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信息 技术 的 飞 路 发展 ， 带 来 数据 的 爆炸 式 增长 ， 以 至 于 我 们 生活 的 这 个 时 代 被 标记 
为 “大 数据 时 代 ”"。 大 数据 ， 是 计算 机 和 网 络 的 应 用 到 达 巨 量规 模 后 的 必然 结果 。 大 数据 
意味 着 前 所 未 有 的 充分 信息 ， 它 直观 地 揭示 了 事物 的 关联 和 规律 ， 对 人 类 社会 有 着 巨大 
的 价值 。 古 往 今 来 ， 人 类 有 记录 的 历史 只 是 沧海 一 票 ， 绝 大 部 分 人 类 活动 的 记忆 都 烟 消 
云 散 。 将 大 数据 推 向 极致 ， 就 是 世界 上 发 生 的 一 切 都 将 永久 留 下 时 空 痕迹 ， 这 是 多 么 激 
动人 心 的 变革 啊 ! 

大 数据 必 不 可 少 的 条 件 是 将 数据 存储 下 来 ， 因 而 人 们 研究 了 各 种 存储 原理 、 设 备 和 
系统 ， 数 据 存储 是 大 数据 的 基础 性 技术 。 随 独 数 据 的 急剧 增长 ， 存 储 技 术 日 新 月 异 ， 在 
无 数 科 技 人 员 的 努力 下 取得 了 巨大 的 进展 。 在 短 短 几 十 年 的 时 间 内 ， 单 位 体积 的 存储 容 
量 提高 了 上 亿 倍 ， 真 是 令 人 赞叹 ! 由 于 IT 设施 〈 包 括 服务 器 、 网 络 和 存储 ) 问 数 据 中 心 
和 云 模式 发 展 ， 存 储 设备 的 种 类 也 越 来 越 多 ， 数 量规 模 越 来 越 大 ， 其 管理 也 越 来 越 复杂 ， 
对 数据 中 心 的 设计 人 员 、 运 营 管 理 人 员 的 要 求 也 越 来 越 高 。 为 了 适应 日 益 复 杂 的 存储 管 
理 ， 需 要 深入 了 解 存储 技术 ， 也 必须 了 解 存储 与 服务 器 及 网 络 间 的 关系 。 因 此 ， 相 关 人 
员 迫 切 需要 一 本 深入 讲解 存储 及 管理 的 教材 。 

《信息 存储 与 IT 管理 》 正 是 针对 相关 科技 人 员 和 管理 人 员 的 迫切 需要 而 及 时 推出 的 
一 本 很 具 系 统 性 和 实用 性 的 教材 。 作 者 在 总 结 多 年 的 研究 成 果 和 技术 开发 经 验 的 基础 上 ， 
首先 从 IT 基础 设施 介绍 出 发 ， 深 入 浅 出 地 介绍 了 数据 中 心 、 存 储 与 应 用 环境 、 服 务 器 的 
基本 概念 和 基本 技术 。 在 此 基础 上 , 逐 章 详细 介绍 了 存储 设备 、 存 储 阵 列 、SAN、IP-SAN、 
NAS 及 对 象 存储 等 主流 存储 技术 。 随 后 ， 又 对 存储 虚拟 化 、 备 份 及 容 灾 等 技术 逐 章 详细 
讲解 。 最 后 ， 对 大 数据 存储 、 云 计算 技术 等 新 技术 做 了 详细 探讨 。 

此 书 的 突出 特点 是 理论 与 实践 紧密 结合 ， 在 每 章 的 最 后 单独 介绍 与 内 容 相对 应 的 华 
为 公司 产品 ， 将 其 作为 范例 从 软 硬 件 层面 具体 剖析 ， 为 读者 提供 了 具体 的 实例 和 技术 借 
鉴 。 相 信 这 是 一 本 适合 数据 管理 与 维护 人 员 和 IT 行业 管理 人 员 理 解 和 掌握 信息 存储 与 管 
理 的 不 可 多 得 的 技术 书籍 ， 也 是 一 本 适合 在 校 大 学 生 和 研究 生 学 习 和 掌握 数据 存储 与 管 
理 技术 的 好 教材 。 
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我 相信 , 《信息 存储 与 IT 管理 》 一 书 通过 对 目前 主流 、 广 为 业界 接受 和 使 用 的 信息 
存储 与 管理 技术 的 深入 介绍 , 对 IT 行业 的 从 业 人 员 与 在 校 学 生 学 习 和 掌握 相关 的 技术 将 
起 到 较 大 的 帮助 作用 。 祝 愿 每 位 读者 都 能 通过 本 书 掌握 信息 存储 与 管理 的 金 钥匙 ! 
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本 书 内 容 组 织 


本 书 共 分 16 章 ， 采 用 了 章 、 节 、 小 节 三 级 结构 ， 分 别 对 应 了 一 级 、 二 级 、 三 级 目录 。 

#18: IT 基础 设施 

随 着 计算 机 技术 的 飞速 发 展 ，IT 基础 设施 得 到 了 越 来 越 多 地 关注 。 本 章 主 要 重点 介 
绍 IT 基础 设施 ， 特 别 是 核心 的 IT 基础 设施 一 一 数据 中 心 。 

第 2 章 : 存储 与 应 用 环境 

本 章 针对 存储 与 应 用 环境 进行 介绍 。 包 括 存 储 的 IO 流程 及 网 络 存 储 技术 ， 机 械 硬 
盘 与 固态 硬盘 的 发 展 历 史 、 结 构 、 原 理 及 特性 ， 主 机 中 与 存储 密切 相关 的 组 成 部 分 ， 以 
及 针对 大 数据 应 用 ， 存 储 系统 所 面临 的 新 的 挑战 。 

第 3 章 : 服务 器 基础 

服务 器 是 整个 IT 系统 的 重要 组 成 部 分 , 随 着 技术 的 发 展 , 服务 器 的 相关 技术 也 发 生 
了 巨大 的 变化 。 本 章 从 服务 器 发 展 历 史 、 服 务 器 的 功能 与 作用 等 方面 入 手 ， 对 服务 器 进 
行 全 面 介绍 ， 包 括 对 服务 器 高 级 应 用 技术 如 双 机 热 备 、 集 群 等 功能 进行 描述 。 

第 4 章 : RAID 技术 及 应 用 

单个 磁盘 的 容量 和 性 能 非常 有 限 ， 也 不 具备 容错 性 ， 为 了 能 够 实现 大 规模 存储 设备 
并 行 ， 增 强 系统 的 容错 能 力 ， 一 种 专用 于 磁盘 资源 整合 和 了 元 余 保 护 的 技术 应 运 而 生 ， 这 
就 是 元 余 磁盘 阵列 (Redundant Arrays of Independent Disks, RAID). 

本 章 从 RAID 的 基本 概念 与 技术 原理 、RAID 级 别 、RAID 中 的 数据 保护 技术 、RAID 
与 LUN 以 及 云 计 算 和 大 数据 时 代 RAID 的 发 展 趋 势 几 个 方面 对 RAID 技术 及 应 用 进行 
介绍 。 

S58: 存储 阵列 技术 及 应 用 

存储 阵列 技术 伴随 着 信息 快速 增长 带 来 的 数据 爆炸 而 出 现 。 在 现代 IT 系统 不 断 升 级 
的 今天 , 数据 存储 需求 也 在 爆炸 性 增长 , 存储 阵列 设备 已 然 成 为 了 IT 系统 的 核心 组 成 部 
分 之 一 。 本 章 将 从 存储 阵列 系统 的 硬件 组 成 出 发 ， 进 而 引出 一 系列 存储 阵列 通用 技术 。 
最 后 ， 介 绍 华为 OceanStor 系列 存储 系统 及 其 应 用 。 

第 6 章 : SAN 技术 及 应 用 

网 络 存 储 技 术 (Network Storage Technologies) 是 对 于 利用 网 络 进行 数据 存储 技术 的 
统称 。 目 前 的 网 络 存储 结构 大 致 分 为 三 种 : 直接 连接 存储 (Direct Attached Storage, DAS). 
网 络 附加 存储 (Network Attached Storage, NAS) 和 存储 区 域 网 络 (Storage Area Network, 
SAN). 其 中 , DAS 是 最 简单 的 一 种 结构 , 存储 设备 直接 通过 SCSI 等 总 线 与 服务 器 相连 。 
随 着 数据 规模 和 数据 流量 的 增加 , DAS 技术 已 不 能 满足 人 们 的 需求 。 如 今 , SAN 和 NAS 
是 两 种 比较 流行 的 技术 。 
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本 章 主 要 介绍 SAN， 包含 原 理 、 组 成 、 常 见 应 用 场景 和 与 其 他 存储 形态 的 对 比 。 

第 7 章 : IP-SAN 技术 及 应 用 

IP-SAN 是 近年 来 十 分 流行 的 一 种 网 络 存储 技术 。 与 上 一 章 介 绍 的 FC-SAN 相 比 ， 
IP-SAN 使 用 了 发 展 成 熟 的 卫 网 络 ， 充 分 降低 了 总 体 拥有 成 本 (total cost of ownership, 
TCO)， 受 到 许多 客户 的 欢迎 。 

本 章 从 IP-SAN 的 产生 和 发 展开 始 ， 详细 阐 述 了 IP-SAN 网 络 架构 、 组 成 部 分 、 协 议 
构成 ，iSCSI 协议 技术 细节 等 方面 ， 同 时 还 对 比 了 几 种 SAN 协议 的 特点 。 

#88: NAS 技术 及 应 用 

本 章 主 要 介绍 NAS (Network Attached Storage， 网 络 附加 存储 ) 的 相关 知识 ， 包 括 
NAS 的 基本 概念 、NAS 的 演化 和 发 展 、NAS 的 工作 原理 以 及 NAS 的 应 用 。 

此 外 ， 结 合 前 一 章 关 于 SAN 的 内 容 ， 对 NAS 和 SAN 进行 比较 与 总 结 ， 并 在 最 后 
对 华为 的 相关 产品 进行 介绍 。 

对 象 存 储 是 一 种 基于 对 象 的 存储 技术 。 与 传统 意义 上 的 提供 面向 块 (block-oriented ) 
接口 的 磁盘 存储 系统 不 同 ， 对 象 存储 系统 将 数据 封装 到 大 小 可 变 的 “容器 ”中 ， 称 为 对 
象 Object)， 通 过 对 对 象 进行 操作 使 系统 工作 在 一 个 更 高 的 层级 中 。 

对 象 存 储 综 合 了 NAS 和 SAN 的 优点 ， 同 时 具有 SAN 的 高 速 访 问 和 NAS 的 数据 共 
享 等 优势 。 本 章 主 要 对 对 象 存 储 技术 进行 介绍 ， 包 括 对 象 存储 技术 的 概念 、 发 展 、 基 本 
原理 与 实现 ， 并 与 SAN、NAS 技术 进行 了 对 比 ， 同 时 还 介绍 了 华为 公司 海量 存储 系统 。 

第 10 章 : 存储 虚拟 化 技术 及 应 用 

虚拟 化 是 一 个 涵盖 范围 非常 广泛 的 概念 ， 它 的 存在 ， 往 往 是 出 于 简化 管理 、 优 化 资 
源 使 用 的 目的 。 简 单 而 言 ， 虚 拟 化 即 是 通过 一 个 软件 抽象 层 ， 将 硬件 平台 划分 为 一 个 或 
多 个 虚拟 机 ， 每 个 虚拟 机 都 与 下 层 硬件 足够 相似 ， 可 以 无 差别 地 支持 软件 运行 。 本 章 将 
主要 介绍 虚拟 化 的 概念 、 发 展 历程 、 前 景 和 趋势 。 同 时 ， 对 虚拟 化 技术 做 了 简单 地 分 类 。 
之 后 详细 系统 地 介绍 存储 虚拟 化 的 技术 细节 。 

第 11 章 : 备份 与 恢复 

随 着 计算 机 技术 在 商业 系统 中 的 普及 以 及 大 量 应 用 系统 的 上 线 ， 企 业 的 信息 安全 重 
要 性 日 益 凸 显 。 但 作为 信息 安全 的 一 个 重要 内 容 ， 数 据 备份 的 重要 性 却 往往 被 忽视 。 

本 章 详细 介绍 备份 的 基础 概念 、 备 份 的 拓扑 结构 、 策 略 的 制定 、 技 术 分 类 及 备份 方 
案 优 化 技术 。 OE 与 应 用 。 

第 12 章 : 容 灾 及 应 用 

容 灾 系统 是 指 在 相隔 较 远 的 异地 , 建立 两 套 或 多 套 功 能 相同 的 IT AS, 互相 之 间 可 
以 进行 健康 状态 监视 和 功能 切换 。 容 灾 技 术 是 系统 高 可 用 性 技术 的 一 个 组 成 部 分 ， 容 灾 
AEA OEE EEEN 特别 是 灾难 性 事件 对 整个 IT 节点 的 影响 , 提 
供 节点 级 别 的 系统 恢复 功能 。 

本 章 介 绍 容 灾 的 定义 、 容 灾 的 关键 指标 RPO 与 RTO、 容 灾 的 类 型 以 及 企业 基于 RPO 
和 RTO 的 要 求 所 实施 的 灾难 恢复 数据 保护 策略 。 在 这 之 后 , 介绍 近年 来 被 充分 运用 于 容 
灾 的 三 种 技术 : 快照 技术 、 镜 像 技术 以 及 复制 技术 ， 并 介绍 容 灾 系统 基于 这 三 种 技术 的 
实现 方式 。 在 本 章 的 结尾 ， 介 绍 华为 在 容 灾 方案 方面 的 相关 技术 与 产品 。 
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第 13 章 : 大 数据 存储 概论 

本 章 首 先 介绍 大 数据 的 概念 ， 说 明 大 数据 的 由 来 、 发 展 历程 、 应 用 及 前 景 。 之 后 着 
重 介绍 关于 大 数据 存储 相关 的 一 些 基本 概念 和 技术 。 最 后 ， 介 绍 华为 在 大 数据 存储 方向 
上 的 相关 产品 和 解决 方案 。 

第 14 章 : 云 计 算 基 础 

在 日 常生 活 当 中 ， 水 、 电 、 煤 气 等 都 是 必 不 可 少 的 一 部 分 ， 这 些 资 源 是 生产 厂家 集 
中 生产 提供 给 我 们 使 用 的 ， 这 种 模式 可 以 极 大 地 节约 资源 ， 方 便 我 们 的 生活 。 如 今 ， 计 
算 机 几乎 也 成 为 了 人 们 生活 当中 必 不 可 少 的 一 部 分 ， 因 此 ， 人 们 希望 这 种 模式 能 够 在 计 
算 机 上 使 用 ， 这 样 就 有 了 云 计 算 (Cloud Computing)。 

本 章 介 绍 云 计算 的 基础 知识 ,包括 云 计算 的 产生 与 发 展 、 云 计算 概念 、 云 计算 模式 、 
云 计 算 应 用 和 云 计算 产品 等 相关 内 容 。 

第 15 章 : 数据 中 心 方案 

本 章 主 要 介绍 数据 中 心 的 发 展 历史 及 其 产生 意义 ， 以 及 随 着 云 计 算 浪潮 和 大 数据 时 
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中 心 解决 方案 。 

第 16 章 : IT 运 维 管理 
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的 实现 与 应 用 。 
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1.1 IT 基础 设施 与 数据 中 心 


1.1.1 IT 基础 设施 一 一 数据 中 心 


IT 基础 设施 主要 涵盖 软件 、 网 络 和 硬件 设备 三 个 方面 。 这 三 种 基础 设施 都 是 围绕 着 
数据 中 心 进行 部 署 的 , 在 IT 基础 设施 中 最 为 核心 的 就 是 数据 中 心 。 因 此 ， 首 先 要 介绍 硬 
件 设 备 中 的 数据 中 心 。 

数据 中 心 (data center) 指 的 是 用 于 部 署 计算 机 系统 及 其 一 系列 配套 设备 的 设施 ， 配 
套 设 备 如 通信 和 存储 系统 。 一 般 来 说 ， 数 据 中 心包 括 见 余 或 备份 供电 设施 、 见 余数 据 通 
信和 连接 设备 、 环 境 控 制 设备 和 各 种 安全 装置 。 

数据 中 心 不 只 是 一 系列 服务 器 的 结合 ， 在 Google 发 布 的 《The Datacenter as a 
Computer》 中 ， 它 被 解释 为 “一 个 能 容纳 多 个 服务 器 以 及 通信 设备 的 多 功能 建筑 物 。 这 
些 设备 是 因为 具有 相同 的 环境 需求 和 物理 安全 需求 而 被 放置 在 一 起 的 ”。 

在 现实 生活 中 ， 小 型 数据 中 心 仅 有 柜子 般 大 (如 图 1-1 所 示 ， 由 一 个 或 几 个 机 柜 
组 成 ) ， 而 大 型 数据 中 心 将 会 占用 一 栋 大 楼 的 部 分 或 者 全 部 (如 图 1-2 所 示 ， 由 大 量 
的 机 柜 组 成 )。 计 算 、 存 储 和 网 络 设备 被 放 在 具有 隔 层 的 成 排放 置 的 机 架 中 ,横向 排 
列 形成 走廊 ， 人 们 只 被 允许 从 走廊 的 前 面 和 后 面 访 问 隔 层 ， 隔 层 的 大 小 一 般 在 19 
英寸 。 





1-2 大 型 数据 中 心 


同时 ， 随 着 科技 的 发 展 ， 一 些 云端 计算 公司 还 开发 了 流动 数据 中 心 (portable data 
center) ， 如 图 1-3 所 示 。 这 种 类 型 的 数据 中 心 可 以 使 用 集装箱 来 放置 并 且 搬 运 和 安装 
快速 。 
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图 1-3 ”华为 集装箱 数据 中 心 


目前 ， 我 国有 9 个 世界 级 数据 中 心 〈world data center) ， 它 们 分 别 是 海洋 学 科 数 据 
中 心 、 地 震 学 科 数 据 中 心 、 地 质 学 科 数 据 中 心 、 空 间 学 科 数 据 中 心 、 天 文学 科 数 据 中 心 、 
气象 学 科 数 据 中 心 、 冰 川 学 科 数 据 中 心 、 资 源 环 境 学 科 数 据 中心 和 地 球 物理 学 科 数 据 中 心 。 

第 15 章 将 对 数据 中 心 进行 详细 介绍 。 


1.1.2 ”数据 中 心 的 物理 环境 需求 


数据 中 心 对 物理 环境 有 着 极其 严格 的 要 求 。 

(1) 温度 和 湿度 。 数 据 中 心 的 建议 温度 为 20C 一 2$SC 。 因 为 设备 在 运行 时 产生 大 量 
的 热 会 加 热 数据 中 心里 的 空气 ， 如 果 这 些 热 量 不 能 及 时 释放 ， 环 境 温度 就 会 持续 上 升 ， 
将 会 造成 设备 及 其 他 部 件 发 生 故 障 。 建 议 湿度 为 40% 一 55%。 如 果 湿 度 过 高 ， 水 蒸气 在 
内 部 组 件 上 凝结 ; 湿度 过 低 会 导致 空气 干燥 ， 进 而 会 对 设备 产生 静电 影响 ， 这 两 种 情况 
都 会 使 设备 发 生 故 障 甚至 损坏 。 

(2) 距离 地 面 高 度 。 一 般 来 说 ， 数 据 中 心 的 地 面 使 用 由 60cm 高 的 可 拆卸 方块 砖 组 
成 的 架空 地 板 。 一 方面 ， 升 高 的 空间 可 以 更 好 地 保证 空气 流通 ， 男 一 方面 ， 这 部 分 空间 
也 为 供电 设施 提供 了 足够 的 物理 空间 。 

(3) 配套 设备 。 数 据 中 心 需要 安装 烟雾 探测 器 ,在 燃烧 产生 明火 之 前 提前 发 现 火 情 ， 
在 火势 增 大 之 前 切断 电源 ， 使 用 灭火 器 自动 灭火 。 数 据 中 心中 不 能 使 用 自动 喷 水 灭火 装 
置 ， 因 为 电子 元 器 件 遇 水 后 很 容易 发 生 故 障 ， 特 别 是 在 电源 未 切断 的 情况 下 。 数 据 中 心 
中 还 应 该 安装 防火 墙 ， 发 生火 灾 时 将 火 源 控制 在 局 部 范围 内 ， 降 低 火 灾 损 失 。 

(4) 在 数据 中 心中 需要 控制 污染 物 进 入 。 机 房 内 不 能 有 和 危害 设备 的 腐蚀 性 气体 和 易 
燃 易 爆 物品 。 

(5) 数据 中 心 的 磁场 干扰 需要 控制 在 安全 范围 内 。 

(6) 数据 中 心 的 电场 和 干扰、 噪音 、 照 度 〈 单 位 面积 上 所 接受 可 见 光 的 能 量 ) 也 要 严 
格 控制 。 

只 有 满足 了 上 述 这 些 要求 ， 数 据 中 心 才 能 正常 运转 ， 为 企业 和 组 织 提 供 服 务 。 


1.1.3 ”数据 中 心 的 发 展 和 趋势 


早期 的 计算 机 系统 通常 操作 以 及 维护 起 来 都 需要 许多 复杂 的 过 程 ， 所 以 需要 一 个 特 
殊 的 环境 来 实施 这 些 操作 。 特 殊 的 环境 包括 安放 设备 的 专用 支架 、 抬 高 的 地 板 和 集成 电 
缆 的 设备 。 早 期 的 计算 机 还 需要 大 量 的 电源 ， 所 以 冷却 设备 是 必 不 可 少 的 ; 同时， 当时 
的 计算 机 是 非常 昂贵 的 物件 并 常常 用 在 军事 领域 ， 所 以 需要 控制 计算 机 的 访问 权限 。 这 
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一 系列 的 方针 举措 可 以 说 是 现在 数据 中 心 产生 的 根源 。 

随 者 计算 机 领域 和 信息 技术 的 不 断 发 展 壮大 ， 人 们 意识 到 IT 基础 设施 的 重要 性 。 在 
20 世纪 90 年 代 微型 机 出 现 之 后 ， 一 些 公司 开始 在 一 个 房间 内 ， 使 用 分 层 设计 来 放置 服 
务 器 ， 构 成 一 个 集合 ， 这 种 方式 在 日 后 流行 起 来 并 被 不 断 地 学 习 和 借鉴 。 

由 于 数据 中 心 可 以 提供 商业 上 的 系统 部 署 和 操作 ， 于 是 许多 公司 开始 建立 规模 庞大 
的 设备 群 ， 成 立 目 己 的 数据 中 心 。 从 2007 年 开始 ， 数 据 中 心 的 设计 、 构 建 和 运作 成 为 了 
普遍 的 趋势 。 

但 是 当今 的 数据 中 心 对 物理 环境 有 着 非常 严 苛 的 需求 ， 由 此 我 们 不 难看 出 现今 的 数 
据 中 心 需要 消耗 大 量 的 资源 来 维持 自身 的 正常 运转 ， 公 司 需 要 为 这 些 消耗 产生 的 费用 买 
单 ， 这 大 大 增加 了 运营 成 本 。 所 以 ， 现 在 数据 中 心 的 发 展 趋势 是 向 绿色 数据 中 心 和 多 层 
次 混合 数据 中 心 转变 。 


1.1.4 ”大 数据 时 代 对 数据 中 心 的 要 求 


数据 中 心 的 基本 设计 理念 是 为 了 实现 对 物理 设备 和 项 目的 静态 资源 管理 和 供应 。 它 
主要 有 3 个 特点 。 

(1) 静态 的 物理 资源 管理 系统 是 其 最 主要 的 特点 。 在 数据 中 心 设计 者 眼中 它 就 是 物 
理 设 备 孤立 堆砌 的 产物 。 

(2) 数据 中 心静 态 的 工作 负载 管理 。 这 样 的 管理 方式 加 上 资源 的 相对 孤立 ， 导 致 了 
数据 中 心 资源 利用 效率 低下 的 问题 。 

(3) 基础 设施 的 静态 耦合 。 它 降低 了 数据 中 心 的 灵活 性 ， 使 数据 中 心 很 难 做 任何 
改变 。 

当前 已 进入 了 大 数据 时 代 。 通 常 意义 的 大 数据 是 指 所 涉及 的 数据 规模 巨大 到 无 法 通 
过 目前 传统 的 软件 工具 ， 在 适当 时 间 内 完成 来 集 、 分 析 和 管理 的 海量 数据 集 。 在 大 数据 
时 代 ， 人 们 对 数据 中 心 的 需求 越 来 越 高 。 

首先 ， 数 据 中 心 要 具备 极 强 的 灵活 性 。 这 意味 这 数据 中 心 应 该 有 足够 的 可 调整 空间 
来 存放 新 的 服务 器 、 存 储 设备 、 基 础 设施 设备 ， 并 且 能 满足 不 同 的 功率 和 计算 要 求 。 

例如 ， 数 据 中 心 需要 有 高 密度 的 特性 。 这 要 求 数据 中 心 合 理 优化 服务 器 设备 在 机 架 
中 的 布局 以 及 空调 设备 布局 ， 以 达到 高 效 供电 和 高 效 散 热 的 目的 ， 优 化 供电 设施 ， 给 机 
架 适 度 足 够 的 电力 ， 以 满足 高 密度 计算 的 需要 ; 优化 散热 制冷 系统 ， 以 避免 高 热量 对 设 
备 造 成 的 损坏 。 

其 次 ， 需 要 建设 绿色 的 数据 中 心 。 要 让 运营 成 本 大 部 分 集中 在 IT 负荷 上 ， 而 不 是 供 
电 和 散热 系统 等 基础 设施 。 这 可 以 大 大 节约 电力 消耗 ， 提 高 社会 能 源 的 利用 率 。 

最 后 ， 数 据 中 心 需要 有 优秀 的 可 靠 性 。 关 键 数据 在 数据 中 心中 一 定 要 绝对 安全 ， 这 
样 才 能 保证 企业 和 社会 的 稳定 运转 。 


1.1.5 “存储 在 数据 中 心 的 作用 


下 面 简 单 介 绍 存 储 在 数据 中 心中 的 作用 ， 其 中 最 重要 的 作用 是 存储 区 域 网 络 。 
存储 区 域 网 络 (storage area network, SAN) 通过 特定 的 互 连 方式 连接 的 若干 台 存 储 
服务 器 组 成 一 个 单独 的 数据 网 络 ， 提 供 企业 级 的 数据 存储 服务 ， 如 图 1-4 Pras. SAN 是 
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一 种 特殊 的 高 速 网 络 ， 连 接 网 络 服务 器 和 诸如 大 磁盘 阵列 或 备份 磁带 库 的 存储 设备 。 它 
使 用 局 域 网 CLAN) 和 广域网 (WAN) 中 类 似 的 单元 ， 实 现存 储 设 备 和 服务 器 之 间 的 互 
连 。 利 用 SAN, 不 仅 可 以 提供 大 容量 的 数据 存储 ， 而 且 地 域 上 可 以 分 散 ， 并 缓解 了 大 量 
数据 传输 对 于 局 域 网 的 影响 。SAN 的 结构 允许 任何 服务 器 连接 到 任何 存储 阵列 不管 数 
据 置 放 在 哪里 ， 服 务 器 都 可 直接 存 取 所 需 的 数据 。 同 时 ，SAN 网 络 部 署 容 易 、 存 储 带 宽 
高 、 扩 展 能 力 强 ， 有 助 于 数据 中 心 建 立 高 效 的 数据 和 信息 管理 。 







LAN 
存储 设备 
应 用 服务 器 存储 设备 
7 存储 设备 
文件 服务 器 


图 1-4 SAN 存储 构造 


现在 ， 在 数据 中 心 领 域 中 还 出 现 了 存储 虚拟 化 的 技术 。 存 储 虚拟 化 〈storage 
virtualization) 就 是 对 存储 硬件 资源 进行 抽象 化 变现 。 通 过 将 多 个 服务 或 功能 与 其 他 的 附 
加 功能 集成 ， 统 一 提供 有 用 的 全 面 功能 服务 。 存 储 虚 拟 化 可 以 在 优化 资源 利用 、 提 升 数 
据 移 动 性 的 同时 ， 帮 助 数据 中 心 大 幅 提 升 整体 架构 的 效率 并 极 大 节约 成 本 。 


1.1.6 ”服务 器 在 数据 中 心 的 作用 


服务 器 是 指 网 络 环境 中 的 高 性 能 计算 机 ， 它 侦 
听 客 尸 机 提交 的 服务 请 求 并 提供 相应 的 服务 ， 如 
图 1-5 所 示 。 

服务 器 的 结构 与 普通 果 面 PC 相似 ， 由 主板 、 
处 理 器 、 人 硬盘 、 内 存 、 系 统 总 线 等 组 成 ， 不 过 它们 
是 针对 具体 的 应 用 特别 定制 的 。 随 着 信息 技术 的 进 
步 ， 网 络 的 作用 越 来 越 明显 ， 对 信息 系统 数据 的 处 
理 能 力 、 安 全 性 等 方面 的 要 求 也 越 来 越 高 ， 因 而 服 
务 器 与 普通 困 面 计算 机 在 处 理 能 力 、 稳 定性 、 可 靠 
性 、 安 全 性 、 可 扩展 性 、 可 管理 性 等 方面 存在 很 大 
差异 。 

服务 器 在 数据 中 心 的 作用 就 是 作为 用 户 访 问 
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数据 中 心 的 媒介 ， 提 供 数 据 共享 的 服务 。 高 密度 、 a 
低 耗 能 的 服务 器 可 以 在 数据 中 心中 发 挥 巨大 作用 。 图 1-5 服务 器 


1.1.7 网络 在 数据 中 心 的 作用 


根据 定义 ， 网 络 是 由 节点 和 连 线 构成 的 ， 表 示 为 一 些 对 象 及 其 相互 联系 的 概念 。 在 
计算 机 领域 中 ， 网 络 是 信息 传输 、 接 收 、 共 享 的 虚拟 平台 。 网 络 将 把 各 个 点 、 面 、 体 的 
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信息 联系 到 一 起 ， 从 而 实现 资源 的 共享 。 

数据 中 心 不 仅 是 一 个 服务 概念 ， 它 还 是 一 个 网 络 概 念 ， 需 要 提供 高 速 传输 服务 和 高 
速 接 入 服务 。 数 据 中 心 通过 提供 给 用 户 综合 全 面 的 解决 方案 ， 为 政府 和 企业 提供 专业 服 
务 ， 使 得 企业 和 个 人 能 迅速 借助 网 络 开 展业 务 。 由 此 可 见 ， 网 络 在 数据 中 心中 起 着 至 关 
重要 的 作用 ， 甚 至 现在 还 有 一 类 数据 中 心 被 称 为 网 络 数据 中 心 〈Internet data center) 。 


1.2 云 数 据 中 心 


1.2.1 传统 数据 中 心 的 挑战 


现今 ， 传 统 数据 中 心 对 能 源 的 消耗 越 来 越 大 。 而 且 这 些 消耗 量 还 在 以 惊人 的 速度 不 
断 增 长 。2006 年 全 球 数 据 中 心 的 能 源 消耗 是 2000 年 的 两 倍 。 但 是 2012 年 ， 这 一 总 量 在 
2006 年 的 基础 上 再 次 翻番 。 由 上 此， 人们 开始 认识 到 传统 数据 中 心 的 弊端 一 一 高 能 耗 。 

1. 高 能 耗 

在 数据 中 心 领 域 中 ， 存 在 一 个 衡量 数据 中 心 效率 的 值 一 一 数据 中 心 总 设备 能 耗 /IT 
设备 能 耗 (power usage effectiveness, PUE) 。 这 个 值 代表 数据 中 心 消耗 的 所 有 能 源 与 IT 
负载 使 用 能 源 的 比值 。 所 有 能 源 即 是 数据 中 心 总 共 消 耗 的 能 源 ，IT 负载 使 用 的 能 源 可 以 
宽泛 地 理解 为 数据 中 心 在 做 它 自 己 分 内 的 事情 时 消耗 的 能 源 ， 那 其 他 的 能 源 是 什么 地 方 
消耗 的 呢 ? 这 个 问题 是 显而易见 的 ， 数 据 中 心中 存在 着 数目 庞大 的 基础 配套 设施 来 维持 
它 的 稳定 运转 ， 剩 下 的 能 源 便 是 这 部 分 的 设施 所 消耗 的 ， 如 图 1-6 所 示 。 


国 IT 设备 
圆 冷却 装置 
四 新 风 系统 
不 间断 电源 
BA 供电 单元 
增 湿 设备 
O 附属 设备 





1-6 ”传统 数据 中 心 能 耗 比例 


大 部 分 数据 中 心 的 PUE 值 在 2.5~3, 这 意味 着 这 些 数据 中 心 的 配套 设施 消耗 的 能 源 
多 于 数据 中 心 本 身 在 运行 时 消耗 的 能 源 ， 这 是 十 分 惊人 的 ; 而 高 水 平 的 数据 中 心 的 PUE 
值 都 普 衣 被 控制 在 2 以 下 ， 虽 然 相 比 来 说 优秀 许多 ， 但 资源 的 消耗 仍然 是 可 观 的 。 

传统 数据 中 心 高 能 耗 的 问题 也 为 使 用 数据 中 心 的 企业 带 来 了 不 小 的 麻烦 ， 而 这 也 成 
了 传统 数据 中 心 第 二 个 被 人 诉 病 的 地 方 一 一 高 运营 成 本 。 

2. 高 运营 成 本 


在 数据 量 飞 速 增长 的 今天 ， 传 统 数据 中 心 的 服务 器 不 断 增加 ， 数 据 中 心机 房 的 规模 
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在 不 断 扩大 ， 因 为 高 密度 的 服务 器 布局 产生 大 量 的 热 ， 空 调 的 数量 要 不 断 增多 ， 制 冷 效 
果 要 不 断 加 强 ， 带 来 了 用 电量 不 断 增加 的 问题 。 这 使 得 传统 数据 中 心 的 运营 成 本 直线 上 
升 ， 影 响 企业 的 资金 周转 。 

在 国内 ， 不 少 企业 的 数据 中 心 电 力 成 本 每 年 需要 几 百 万 元 、 几 千 万 元 ， 更 有 甚 者， 
运营 成 本 超过 了 一 亿 元 。 这 大 大 影响 了 企业 的 正常 运作 , 甚至 有 可 能 导致 企业 破产 倒闭 。 
一 些 企业 的 数据 中 心 已 经 陷入 了 成 本 危机 ， 电 费 高 昂 ， 配 套 设施 冷却 能 力 不 足 ， 无 法 
满足 服务 器 和 存储 设备 的 需要 ; 另 一 方面 ， 没 有 足够 的 空间 和 场地 来 增长 IT 基础 设施 
的 容量 。 

3. 低 可 用 性 

高 能 耗 不 但 带 来 了 高 运营 成 本 , 在 某 种 程度 上 , 它 还 降低 了 传统 数据 中 心 的 可 用 性 。 
在 中 国 的 一 些 地 区 ， 人 口 密集 ， 用 电量 巨大 ， 而 地 区 却 没 有 足够 的 供电 能 力 。 于 是 ， 为 
了 保障 人 们 的 正常 生活 秩序 ， 这 些 地 方 的 企业 面临 着 用 电 方 面 的 制约 和 限制 。 由 于 数据 
中 心 高 能 耗 的 问题 没有 解决 ， 数 据 中 心 就 可 能 停止 运作 ， 同 时 新 的 数据 中 心 也 没有 办 法 
建立 。 这 会 对 企业 造成 不 可 弥补 的 损失 。 

4. 高 物理 环境 要 求 

接着 ， 传 统 数 据 中 心 的 问题 还 体现 在 它 会 轻易 地 被 物理 环境 左右 。 传 统 数 据 中 心 的 
整体 布局 和 制冷 系统 的 配备 一 旦 不 合理 ， 便 会 导致 数据 中 心 总 体 资 源 利 用 率 下 降 和 产生 
局 部 过 热 , 影响 稳定 运作 , 国内 一 些 数据 中 心机 房 的 温度 甚至 可 以 达到 40'C 左 右 。 此外， 
布局 不 合理 ， 胡 乱 布 放 电源 线 绕 ， 缺 少 保 障 电 源 配 备 使 得 传统 数据 中 心 的 安全 运行 也 成 
为 一 个 大 问题 。 

5. 使 用 效率 低下 

传统 数据 中 心 的 使 用 效率 问题 也 一 直 困 扰 着 人 们 。 据 调查 得 知 ， 大 部 分 传统 数据 中 
心中 的 服务 器 和 网 络 设备 的 利用 率 仅 仅 为 24% 一 30%, 有 一 些 数据 中 心 的 CPU 利用 率 和 
便 盘 利用 率 都 在 10% 以 下 ， 这 也 是 传统 数据 中 心 高 耗 能 的 原因 ， 资 源 利 用 率 实在 是 太 过 
{KF 

6. 高 废气 排放 

电子 设备 造成 的 环境 污染 不 容 小 舰 。 据 EPA 统计 ，2012 年 仅 美国 地 区 就 生产 了 
3 412 万 吨 电 子 垃 圾 ; 而 据 Gartner 2007 年 统计 , 全 球 信息 技术 工业 二 氧化 碳 排放 量 相当 
于 全 球 总 量 的 2%， 与 整个 航空 工业 的 二 氧化 碳 排 放量 相等 。 解 决 传统 数据 中 心 存 在 的 
高 污染 以 及 高 二 氧化 碳 排放 成 为 了 企业 必须 肩负 的 社会 责任 。 但 是 ， 大 部 分 企业 没有 能 
力 解 决 这 一 问题 ， 因 为 这 是 传统 数据 中 心 本 身 结 构 的 问题 。 

现在 ， 传 统 数据 中 心中 存在 的 问题 非常 严重 ， 是 时 候 改 变 了 。 


1.2.2” 云 数据 中 心 的 主要 架构 


传统 数据 中 心 存在 的 种 种 问题 ， 使 其 很 难 满 足 企 业 对 最 优 资源 的 调度 部 署 ， 以 及 提 
升 管理 效率 的 要 求 ， 并 存在 安全 性 、 稳 定性 以 及 维护 成 本 等 问题 。 对 于 企业 而 言 ， 如 何 
让 数据 中 心 变 得 更 加 灵活 ， 同 时 降低 能 耗 与 运营 成 本 ， 已 经 变 成 了 发 展 过 程 中 面临 的 重 
大 难题 。 云 数据 中 心 的 出 现 无 疑 是 一 个 新 的 进展 。 

云 数据 中 心 可 以 定义 为 管理 平台 采用 云 架构 的 数据 中 心 。 首先 , 我 们 要 了 解 云 计算 。 
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云 计 算是 将 计算 任务 分 配 在 由 众多 信息 设备 构成 的 云 〈 资 源 池 ) 上 ， 使 系统 可 以 获取 相 
对 廉价 的 信息 服务 以 及 计算 和 存储 空间 的 计算 模型 。 

云 计 算数 据 中 心 是 一 种 基于 云 计 算 架 构 的 ， 计 算 、 存 储 及 网 络 资源 松 耦 合 ， 完 全 虚 
拟 化 各 种 开 设备 、 模 块 化 程度 较 高 、 自 动 化 程度 较 高 、 具 备 较 高 绿色 节能 程度 的 新 型 数 
据 中 心 。 

云 数据 中 心 的 特点 首先 是 高 度 的 虚拟 化 ， 这 其 中 包 插 服务器、 存储 、 网 络 、 应 用 等 
虚拟 化 ， 这 使 用 户 可 以 按 需 调用 各 种 资源 ， 其 次 是 自动 化 管理 程度 ,包括 对 物理 服务 器 、 
虚拟 服务 器 的 管理 ， 对 相关 业务 的 自动 化 流程 管理 、 对 客户 服务 的 收费 等 自动 化 管理 ; 
最 后 是 绿色 节能 , 云 计 算数 据 中 心 在 各 方面 符合 绿色 节能 标准 , 一 般 PUE 值 不 超过 1.5. 

除了 高 度 的 虚拟 化 等 特征 ， 云 计算 中 心 还 在 日 益 发 展 中 引进 了 许多 新 技术 和 新 产 
品 ， 如 低 功 耗 CPU. MATES. 

接 下 来 要 介绍 云 数据 中 心 的 主要 架构 。 

1， 云 数据 中 心 的 主机 系统 架构 

云 计算 的 核心 是 集中 的 计算 力 和 规模 性 突破 。 云 数据 中 心 的 硬件 和 基础 架构 取决 于 
它 对 外 提供 的 计算 力 。 从 客户 的 需求 来 看 ， 云 数据 中 心 需要 采用 三 层 架 构 。 第 一 层 是 高 
性 能 、 稳 定 可 靠 的 高 端 计算 ， 用 于 处 理 包 括 对 外 的 数据 库 、 商 务 智 能 数据 挖掘 等 关键 服 
务 的 计算 。 第 二 层 一 般 采 用 高 密度 、 低 成 本 的 集成 服务 器 ， 用 于 面向 众多 普通 应 用 的 通 
用 性 计算 ， 提 供 低 成 本 计算 的 解决 方案 。 这 类 的 计算 对 硬件 的 要 求 不 高 ， 所 以 一 般 采 用 
上 述 服务 器 来 节约 成 本 。 第 三 层 是 以 高 性 能 集群 作为 硬件 基础 的 服务 器 ， 面 向 科学 计算 
等 业务 ， 需 要 提供 百 万 亿 、 千 万 亿 次 计算 能 力 的 高 性 能 计算 。 

2. 云 数 据 中 心 的 网 络 架 构 

云 数据 中 心 的 网 络 系统 总 体 规划 应 该 坚持 区 域 化 、 层 次 化 、 模 块 化 的 理念 ， 这 使 得 
网 络 层 次 更 加 清楚 ， 功 能 更 加 明确 。 数 据 中 心 网 络 可 以 从 以 下 几 个 方面 进行 规划 。 

按照 网 络 结构 中 设备 不 同 的 作用 , 可 以 把 网 络 系统 划分 为 核心 层 、 汇 聚 层 和 接 入 层 。 
核心 层 的 功能 主要 是 实现 骨干 网 络 之 间 的 优化 传输 , 是 所 有 流量 的 最 终 承 受 者 和 汇聚 者 。 
汇聚 层 可 以 连接 接 入 层 的 节点 和 核心 层 的 中 心 。 而 接 入 层 是 最 终 用 户 与 网 络 的 接口 ， 提 
供 即 插 即 用 的 特性 。 

按照 业务 性 质 和 用 户 的 不 同 ， 网 络 系统 可 以 划分 为 内 部 核心 网 、 远 程 业 务 专 网 、 公 
共 服 务 网 等 区 域 。 

从 网 络 服务 的 数据 应 用 业务 的 独立 性 ， 网 络 系统 划分 为 存储 区 、 应 用 业务 区 、 前 置 
区 、 系 统管 理 区 、 托 管区 、 外 联网 络 接 入 区 、 内 部 网 络 接 入 区 。 

3. 云 数据 中 心 的 存储 系统 架构 

在 云 平台 中 ， 要 如 何 放 置 数 据 是 一 个 十 分 重要 的 问题 。 在 使 用 过 程 中 ， 数 据 需 要 被 
分 配 到 多 个 节点 的 多 个 磁盘 中 , 而 现今 能 够 达到 这 个 目的 的 存储 技术 只 有 两 种 , SAN C4 
储 区 域 网 络 ) 系统 和 集群 文件 系统 。 

4. 云 数 据 中 心 应 用 平台 架构 

云 数 据 中 心 应 用 平台 采用 面向 服务 架构 (service-oriented architecture, SOA) 的 方式 ， 
因为 应 用 平台 为 部 署 和 运行 系统 提供 所 需 的 基础 设施 资源 ， 所 以 应 用 开发 人 员 无 需 关 心 
应 用 的 底层 硬件 和 应 用 的 基础 设施 ， 并 且 可 以 根据 应 用 需求 动态 扩展 应 用 系统 所 需 的 
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资源 。 
此 外 还 有 一 种 方法 把 云 数 据 中 心 的 构成 更 直观 地 划分 成 如 图 1-7 所 示 的 架构 。 


Software as a Service 


Google Apps Salesforce CRM Office Web Apps Zoho 


HTML JavaScript CSS Flash Silverlight 


Platform as a Service 
Force.com Google App Engine Heroku 


REST 多 租户 。 并 行 处 理 ”应 用 服务 器 ”分 布 式 缓存 


Infrastructure as a Service 
Amazon EC2 IBMBlueCloud CiscoUCS  Joyent 


系统 虚拟 化 ”分 布 式 存储 。 关系 型 数据 库 ”NoSQL 





图 1-7 云 数据 中 心 染 构 


这 种 云 计 算 架 构 分 为 服务 和 管理 两 大 部 分 。 在 服务 方面 ， 以 提供 用 户 各 种 基于 云 的 
服务 为 主 ， 共 包含 3 个 层次 。 

(1) 软件 即 服务 (software as a service, SaaS) . SaaS 是 一 种 通过 互联 网 提供 软件 
服务 的 应 用 模式 。 提 供 商 为 用 户 搭 建 所 需要 的 所 有 网 络 基 础 设施 以 及 软 硬 件 运作 平台 ， 
而 用 户 只 需要 通过 互联 网 便 可 使 用 此 服务 。 浏 览 器 就 是 一 种 典型 的 软件 , 即 服务 的 例子 。 

(2) 平台 即 服务 (platform as a service, PaaS) . PaaS 是 把 相应 的 服务 器 平台 或 者 
开发 环境 作为 一 种 服务 来 提供 的 商业 模式 。 它 与 SaaS 最 大 的 区 别 就 是 用 户 能 控制 应 用 程 
序 ， 以 及 运行 应 用 程序 的 环境 。 | 

(3) 基础 设施 即 服务 (infrastructure as a service, IaaS) . laaS 是 一 种 提供 给 用 户 对 
所 有 设施 使 用 权力 的 服务 。 用 户 能 够 部 署 和 运行 任意 软件 ， 包 括 操作 系统 和 应 用 程序 。 

在 管理 方面 ， 以 云 管理 层 为 核心 确保 云 计算 数据 中 心 的 有 效 管理 和 安全 稳定 运行 。 


1.2.3 ”信息 技术 与 通信 技术 融合 


在 信息 技术 与 通信 技术 融合 的 过 程 中 ， 运 营 商 需 要 建立 数据 中 心 ， 满 足 从 传统 的 基 
础 网 络 运营 商 转型 为 综合 信息 服务 提供 商 的 需求 。 

21 世纪 初 ， 八 国 集团 在 冲绳 发 表 的 《全 球 信息 社会 冲绳 宪章 》 中 提 到 : “信息 通信 
技术 (ICT) 是 21 世纪 社会 发 展 最 强 有 力 的 动力 之 一 ， 并 将 迅速 成 为 世界 经 济 增长 的 重 
要 动力 。” 

虽然 ICT 看 似 是 信 息 (information) 、 通 信 (communication) 和 技术 (technology) 
3 个 词 的 英文 单词 的 词 头 组 合 ， 但 它 其 实 是 由 信息 技术 (information technology) 与 通信 
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技术 (communication technology) 相 融 合 而 成 的 一 个 新 概念 。 

ICT 经 常 被 用 来 指 代 一 种 扩展 的 IT 概念 ， 但 它 是 一 个 强调 了 通信 、 集 成 电话 通信 、 
计算 机 以 及 必要 的 企业 软件 、 中 间 设 备 、 储 存 和 多 媒体 系统 的 更 加 具体 的 概念 。 它 可 以 
帮助 用 户 得 到 、 储 存 、 转 移 和 处 理 信息 。 

ICT 这 个 词 最 早 是 在 20 世纪 80 年 代 的 学 术 研 究 中 被 提出 ， 但 是 它 真 正 进 入 公众 视 
对 则 是 在 1997 年 的 英国 政府 报告 以 及 2000 年 英国 、 威 尔 士 、 北 爱尔兰 的 国民 教育 课程 中 。 


1.2.4 ”服务 器 在 ICT 背景 下 的 主要 需求 和 应 用 场景 


在 ICT 背景 下 ， 对 服务 器 的 需求 就 是 结构 简单 、 运 
行 稳定 、 高 效率 、 高 扩展 性 、 硬 件 共 享 ， 并 能 达到 节能 、 
降 耗 、 降 低 成 本 的 目的 。 

典型 的 服务 器 有 以 下 几 种 。 

华为 Tecal X8000 高 密度 机 柜 服 务 器 ， 融 高 密度 、 节 
能 、 易 维护 、 多 应 用 等 特点 于 一 映 ， 是 数据 中 心 建设 的 
理想 选择 ， 如 图 1-8 Pra. 

IBM 推出 的 高 密度 架构 服务 器 ， 采 用 NeXtScale 
System， 可 以 安置 三 倍 于 以 前 的 处 理 器 内 核 。 

Facebook 的 新 型 数据 中 心 ， 采 用 开放 服务 器 模型 ， 
裁剪 一 切 多 余部 件 ， 去 掉 塑 料 前 面板 、 金 属 项 帝 、 多 余 
插 槽 、 外 设 、USB 控制 器 ， 以 及 液晶 面板 等 一 切 对 效率 
没有 贡献 的 组 件 。 

美国 超 微 公司 的 FatTwin 服务 器 ,拥有 适用 于 大 规模 
数据 中 心 和 云 计算 部 署 的 高 性 能 双 处 理 器 8 节点 /4U 热 插 拔节 点 配置 。 采 用 气流 优化 设 
计 ， 在 35'C 时 能 提供 最 高 性 能 ， 减 少 空调 能 耗 ， 进 而 节约 成 本 。 


1.2.5 ”存储 在 ICT 背景 下 的 主要 需求 和 应 用 场景 


企业 及 互联 网 数据 以 每 年 50% 的 速率 在 增长 ， 新 增 数据 中 多 数 为 非 结构 化 数据 (如 
办 公文 档 、 文 本 、 图 片 、HTML、 报 表 、 图 像 、 音 频 、 视 频 等 ) ， 如 何 从 数量 庞大 且 杂 
乱 无 章 的 非 结 构 化 数据 中 迅速 提取 有 价值 的 信息 ， 形 成 商业 决策 成 为 各 类 型 企业 生存 的 
基础 。 数 据 持续 增长 以 及 数据 应 用 的 一 个 主要 特点 是 实时 性 或 者 近 实 时 性 。 因 此 ， 高 性 
能 、 高 吞吐 率 、 大 容量 的 基础 存储 设备 更 符合 企业 和 互联 网 的 需求 。 在 云 时 代 ， 数 据 中 
心 储 存 着 众多 用 户 的 数据 ， 因 此 ， 存 储 系统 的 安全 性 就 显得 尤为 重要 。 其 次 ， 在 ICT H 
景 下 ， 存 储 系统 需要 有 极 强 的 兼容 性 ， 因 为 用 户 的 操作 系统 各 不 相同 ， 要 加 强 用 户 体验 
就 一 定 要 加 强 存储 的 兼容 性 。 

典型 存储 介质 有 以 下 几 种 。 

固态 硬盘 〈solid state drive, SSD) 如 图 1-9 Bras. SSD 可 以 在 相同 的 能 耗 下 完成 更 
多 的 工作 , 一 块 3.5 英寸 ,15 000 转 / 秒 转速 的 硬盘 在 工作 时 会 消耗 14 一 19W 的 电力 而 在 
空 亲 和 会 消耗 8 一 14W 的 电力 。 但 是 一 块 SSD 在 工作 时 只 会 消耗 18W 的 电力 ， 在 空 
闲 时 消耗 不 到 O.5W. SSD 可 以 在 很 大 程度 上 降低 能 耗 ， 使 数据 中 心 更 加 环境 友好 ， 符 





图 1-8 ”华为 Tecal X8000 服务 器 
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合 社 会 的 发 展 需 要 。 





图 1-9 SSD 固态 硬盘 


1.2.6” 云 计算 在 ICT 背景 下 的 主要 需求 和 应 用 场景 


在 ICT 背景 下 ， 对 云 计 算 的 需求 因 企 业 的 不 同 而 不 尽 相 同 ， 根 据 用 户 的 不 同 需 求 可 
以 分 为 公有 云 、 私 有 云 和 混合 云 几 种 类 型 。 

典型 的 云 计 算 解 决 方案 有 以 下 几 种 。 

华为 FusionManager ZEHRA ILE 1-10) 可 以 对 计算 、 网 络 和 存储 等 虚拟 资源 
进行 集中 调度 和 管理 ， 进 而 提升 运 维 效率 ， 缩 短 业 务 部 署 时 间 ， 保 证 系统 的 安全 性 和 可 
靠 性 ， 帮 助 运营 商 和 企业 构筑 安全 、 绿 色 、 节 能 的 云 数据 中 心 。 


资源 统计 和 监控 
资源 集群 管理 
基础 设施 资源 管理 





华为 虚拟 化 软件 第 三 方 虚拟 化 软件 物理 基础 设施 


1-10 4% FusionManager 云 管理 系统 


谷歌 拥有 庞大 的 数据 中 心 和 创新 的 网 络 服 务 , 但 是 谷歌 不 提供 具体 的 IT 产品 。 因 为 
谷歌 的 主打 业务 是 搜索 和 广告 ， 同 时 也 为 消费 者 提供 一 些 云 服 务 。 要 用 谷歌 的 云 服务 ， 
用 户 必须 把 自己 的 信息 和 数据 放 在 谷歌 的 云 中 才 可 以 。 因 此 ， 要 使 用 谷歌 的 云 计 算 ， 用 
户 必 须 将 目 己 的 需求 或 服务 融合 到 谷歌 的 系统 和 服务 内 才能 使 用 。 

IBM 的 云 服 务 CloudBurst 由 Power 服务 器 、 处 理 器 内 核 、 虚 拟 机 、CloudBurst 软件 
和 VMware ESXi 内 置 管理 程序 组 成 ，IBM 云 计 算 的 目标 是 针对 在 X64 服务 器 上 运行 的 
特殊 工作 负载 ， 普 及 它们 的 Power 处 理 器 和 大 型 机 系统 。 

微软 在 传统 操作 系统 和 开发 工具 方面 具有 极 强 的 影响 力 ， 比 如 拥有 成 熟 的 Windows 
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操作 系统 、 已 达 大 规模 商用 的 Hyper-V 虚拟 化 产品 和 用 户 熟 悉 的 .NET 技术 架构 ， 等 等 。 
同时 ， 微 软 在 在 线 运营 方面 也 积累 了 大 量 的 服务 运营 经 验 ， 早 已 形成 Live Messenger. 
MSN, Hotmail 等 明星 产品 。 因 此 ， 微 软 云 计 算 不 仅 在 用 户 端 有 很 丰富 的 体验 ， 在 云端 
还 可 以 为 客户 提供 很 丰富 的 体验 。 而 客 尸 如 果 选 择 微软 的 云 服 务 ， 微 软 就 允许 用 户 有 目 
己 的 云 ， 或 者 让 用 户 使 用 微软 合作 伙伴 提供 的 云 服务 ， 让 客户 来 使 用 微软 的 公共 云 。 总 
之 ， 微 软 采 用 的 是 一 种 混合 的 方式 ， 给 拥护 自己 选择 的 权利 。 


1.2.7 ”数据 中 心 在 ICT 背景 下 的 主要 需求 和 应 用 场景 


在 ICT 背景 下 ， 数 据 中 心 要 求 具有 高 密度 、 高 灵活 性 、 高 可 靠 性 、 绿 色 环保 的 特点 。 
因为 传统 数据 中 心 无 法 满足 新 一 代 越 来 越 高 密度 的 IT 设备 对 电源 和 制冷 的 要 求 , 大 多 数 
机 房 没 有 更 多 的 空间 来 放置 新 服务 器 、 存 储 设备 和 基础 设施 设备 ; 而 能 源 成 本 占 数 据 中 
心 运营 成 本 的 比例 越 来 越 高 ， 只 有 低 于 一 半 的 电力 用 于 IT 负荷 ， 其余 的 电力 则 用 于 供电 
和 散热 系统 等 基础 设施 ， 关 键 数 据 的 安全 对 全 球 经 济 的 影响 越 来 越 大 。 

典型 的 数据 中 心 方案 有 以 下 几 种 。 

C1) 为 适应 不 同 企业 需求 ， 华 为 推出 了 小 、 中 、 大 3 种 模块 化 数据 中 心 ， 如 图 1-11 
所 示 。 这 些 数据 中 心 采 用 all-in-room 一 体 化 集成 方案 ， 具 有 高 密 模块 化 、 高 可 靠 性 和 安 
全 性 、 快 速 灵活 部 署 、 简 单 低 耗 、 监 控 完善 等 优 反 。 





图 1-11 ”华为 中 型 模块 化 数据 中 心 


(2) 英特尔 重 塑 数据 中 心 : 随 丰 快速 交付 服务 、 大 量 数据 增长 以 及 退 求 更 低 成 本 等 
需求 和 压力 的 不 断 增长 ， 服 务 器 、 网 络 和 存储 基础 设施 正在 通过 目 身 的 不 断 完 善 来 更 好 
地 适应 日 益 多 样 化 的 工作 负载 。 英 特 尔 通过 全 新 针对 冷 数据 存 储 、 微 型 服务 器 及 入 门 级 
网 络 等 特定 工作 负载 优化 的 技术 ， 帮 助 云 服务 提供 商 从 规模 更 小 、 能 效 更 高 的 处 理 中 获 
益 ， 并 为 客户 和 企业 提供 出 色 的 体验 。 

(3) 赛 门 铁 克 数据 中 心 转型 : 赛 门 铁 克 希望 在 数据 中 心 架 构 上 进行 一 场 革 命 。 传 统 
的 全 最 底层 是 存储 、 服 务 器 、 中 间 件 、 安 全 应 用 ， 赛 门 铁 克 想 要 打破 这 样 的 模式 为 用 户 
带 来 更 新 的 技术 。 
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本 章 从 数据 中 心 开 始 介 绍 IT 基础 设施 。 在 传统 数据 中 心 一 节 中 , 详细 阐释 了 传统 数 
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据 中 心 的 构成 、 产 生 及 发 展 过 程 。 第 二 节 介 绍 了 云 计 算数 据 中 心 这 一 新 概念 ， 详 细 比 较 
了 其 对 于 传统 数据 中 心 的 优势 并 描绘 了 这 一 技术 的 未 来 发 展 方向 。 读 者 学 完 本 章 后 ， 应 
该 对 以 下 概念 有 清楚 的 认识 。 

。 数据 中 心 的 定义 以 及 其 构成 。 

。 存储、 服务器、 网 络 在 数据 中 心中 的 作用 。 
© 云 数 据 中 心 的 产生 背景 和 发 展 前 景 。 


云 数据 中 心 的 架构 。 
14 练习 题 
一 、 选 择 题 
1. 现今 对 数据 中 心 的 需求 不 包括 以 下 选项 中 的 Re 
A. 高 密度 B. 高 延伸 性 C. 高 度 结构 化 D. 高 灵活 性 
ZR (C) 
2. 传统 数据 中 心 的 组 成 中 ， 不 包含 以 下 选项 中 的 ie 
A. 计算 机 系统 B. 监控 设备 C. 存储 系统 D. 排污 系统 
答案 (D) 
3. 在 现实 生活 中 ， 数 据 中 心 可 以 是 〈 Bt ne 
A. 集装箱 B. 大 楼 C. 房间 D. KE 
答案 (ABC) 
4. WF ¢ ) 选项 不 是 传统 数据 中 心 的 弊端 。 
A. 高 耗 能 B. 高 成 本 C. 利用 率 低 下 D. 不 稳定 
答案 (D) 
二 、 简 答题 


在 ICT 背景 下 ， 对 存储 、 服 务 器 、 云 计算 、 数 据 中心 提 出 了 怎样 的 要 求 ? 存储 、 服 
务 器 、 云 计算 、 数 据 中 心 达 到 要 求 之 后 的 益处 是 什么 ? 


2.1 
2.2 
2.3 
2.4 
2.0 
2.6 





存储 的 应 用 环境 
存储 设备 

主机 与 应 用 

大 数据 应 用 的 挑战 
本 章 总 结 

练习 题 
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关于 本 章 


本 章 针 对 存储 与 应 用 环境 进行 介绍 。 第 一 节 介 绍 存 储 的 IO 流程 及 网 络 存储 技术 ; 第 二 
广 详 细 阐 述 两 种 最 重要 的 存储 介质 一 一 机 械 硬盘 与 固态 硬盘 的 发 展 历 史 、 结 构 、 原 理 及 特 
性 ; 第 三 节 介绍 主机 中 与 存储 密切 相关 的 组 成 部 分 ; 最 后 一 节 结 合 当 下 非常 热 的 大 数据 应 
用 ,介绍 存储 系统 面临 的 新 挑战 。 
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2.1 存储 的 应 用 环境 


2.1.1 存储 的 I/O 流程 


在 计算 机 系统 中 ，LO 通常 是 指 信息 处 理 系统 (如 一 台 计 算 机 〉 和 外 部 世界 之 间 的 
通信 ， 而 外 部 世界 可 以 是 人 或 者 是 其 他 的 信息 处 理 系统 。 存 储 系统 的 VO 就 是 存储 系统 
与 外 部 世界 间 的 通信 ， 如 外 部 世界 对 存储 系统 中 数据 的 访问 等 。 在 计算 机 中 看 到 的 文件 
系统 通常 呈 目 录 结构 。 例 如 ， 在 Linux Ext 文件 系统 中 ， 有 一 个 根 目 录 ， 目 录 下 可 以 存 
放 文 件 夹 和 文件 ， 而 文件 夹 中 又 可 以 包含 子 文件 夹 或 者 文件 。 我 们 通过 文件 路 径 来 定位 
所 需要 的 数据 ， 并且 可 以 在 操作 系统 中 打开 、 编 辑 、 移 动 、 复 制 、 粘 贴 、 删 除 这 些 文件 。 
然而 在 物理 层面 ， 我 们 看 到 的 存储 设备 却 是 完全 不 同 的 形态 ， 它 可 以 是 人 硬盘、 光盘 、 内 
存盘 、 存 储 卡 ， 也 可 以 是 其 他 存储 设备 。 那 么 ， 在 计算 机 系统 中 ， 数 据 从 用 户 所 看 到 的 
文件 ， 到 最 终 存 储 在 底层 存储 设备 上 的 信息 ， 中 间 要 经 过 哪些 流程 呢 ? 

在 计算 机 系统 中 , 数据 存储 的 IO 流程 示意 , 如 图 2-1 所 示 。 

(1) 应 用 程序 通过 系统 调用 来 访问 数据 。 系 统 调用 是 操作 系 
统 为 用 户 程 序 提供 服务 的 一 套 接口 ， 其 中 包含 了 进程 控制 、 文 件 
管理 、 设 备 管 理 、 数 据 传输 和 信息 管理 等 功能 。 

(2) 由 文件 系统 处 理 数据 请 求 。 文 件 系统 负责 将 文件 以 某 种 
特定 的 方式 存放 在 磁盘 的 数据 块 上 。 当 它 收 到 操作 系统 发 来 的 文 
件 读 写 请 求 时 , 便 将 请 求 转化 为 对 磁盘 上 数据 块 的 读 写 操作 。 需 
要 注意 的 是 , 文件 系统 下 的 磁盘 通常 是 指 钦 辑 卷 ， 这 是 一 种 将 物 
理 设备 逻辑 分 区 后 产生 的 一 块 虚拟 磁盘 ， 这 块 虚 拟 磁盘 上 的 地 址 到 实际 物理 设备 上 地 址 
的 映射 ， 是 通过 逻辑 卷 管理 器 来 维护 的 。 因 此 ， 对 人 逻辑 着 上 数据 块 的 操作 ， 再 经 过 逻辑 
卷 管理 器 处 理 ， 转 化 为 真实 物理 设备 上 的 数据 块 操作 。 

(3) 驱动 程序 负责 从 物理 设备 读 写 数据 。 由 于 真实 的 物理 设备 千差万别 ， 操 作 系统 
无 法 预先 知道 如 何 操作 每 一 个 设备 ， 因 此 ， 这 些 设备 接 入 计算 机 时 ， 需 要 安装 一 个 特殊 
的 程序 一 一 驱动 程序 ， 这 个 程序 运行 在 操作 系统 上 ， 专 门 负责 与 相应 的 设备 进行 交互 。 
当 操 作 系 统 想 要 在 一 个 物理 存储 设备 上 读 写 一 个 数据 块 时 ， 它 将 请 求 交 给 该 设备 的 驱动 
程序 ， 由 驱动 程序 来 控制 存储 设备 完成 剩余 的 工作 ， 从 存储 设备 指定 位 置 上 读 取 数据 ， 
或 者 将 数据 写 入 设备 的 指定 位 置 。 


2.1.2 网络 存储 技术 


在 数据 爆炸 式 增长 的 信息 时 代 ， 传 统 存储 系统 由 于 其 容量 、 访 问 速度 、 处 理 速 度 等 
限制 ， 无 法 满足 数据 密集 型 应 用 的 需求 。 传 统 的 存储 环境 是 单机 存储 系统 。 单 机 存储 的 
个 人 计算 机 或 服务 器 ， 往 往 采 取 人 硬盘 等 存储 设备 内 置 的 方案 。 面 对 庞大 的 用 户 量 和 数据 
量 , 单机 存储 系统 存在 看 天 然 的 扩展 瓶颈 , 也 不 利于 数据 的 共享 。 尽管 摩尔 定律 告诉 我 们 ， 
在 价格 不 变 的 情况 下 ， 硬 件 性 能 每 隔 18 个 月 便 会 提升 一 倍 。 但 存储 技术 的 横向 扩展 ， 显 





2-1 存储 的 IO 流程 
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然 要 比 纵 问 扩展 容易 得 多 。 因 此 , 构建 基于 网 络 的 存储 系统 , 成 为 人 们 广泛 而 迫切 的 需求 。 
网 络 存储 技术 (network storage technologies) 是 对 基于 网 络 进 行 存储 的 技术 统称 。 
一 个 抽象 的 网 络 存 储 系统 通常 具有 如 图 2-2 所 示 * 





的 结构 。 主机 
在 网 络 存储 系统 中 ， 通 过 网 络 将 存储 设备 与 N OWAL fF 
主机 连接 。 根 据 所 用 网 络 的 不 同 ， 网 络 存 储 结构 
大 致 分 为 以 下 3 种 类 型 。 
(1) HÆTTA (direct attached storage, DAS): EEN 
存储 设备 直接 通过 总 线 或 电费 连接 到 服务 器 。 


(2) 存储 区 域 网 络 (storage area network, 
SAN): 它 是 一 种 通过 光纤 集线器 、 光 纤 路 由 器 、 
光纤 交换 机 等 连接 设备 将 磁盘 阵列 、 磁 带 等 存储 
设备 与 相关 服务 器 连接 起 来 的 高 速 专用 子 网 。 

(3) 网 络 附 加 存储 (network attached storage, 图 2-2 ”网络 存储 系统 
NAS): 将 存储 设备 通过 以 太 网 络 拓扑 结构 连接 到 服务 器 上 ， 实 现 文件 级 别 的 共享 。 

第 6 章 将 对 网 络 存 储 技术 进行 详细 介绍 。 





2.2 存储 设备 


在 计算 机 发 展 的 历史 中 ， 出 现 了 许多 种 存储 介质 ， 如 半导体 、 软 盘 、 磁 带 、 硬 盘 、 
光盘 等 。 这 些 存储 介质 被 制作 成 各 种 各 样 的 存储 设备 ， 用 于 持久 地 存储 信息 。 机 械 硬 盘 
和 固态 硬盘 是 其 中 最 为 常见 和 重要 的 两 种 存储 设备 ， 它 们 被 广泛 使 用 在 现在 的 计算 机 系 
统 中 。 本 节 将 详细 介绍 这 两 种 存储 设备 的 发 展 历史 、 结 构 、 原 理 、 特 性 以 及 性 能 指标 。 


2.2.1 机械 硬 盘 


1. 机械 硬 盘 的 产生 、 发 展 和 趋势 

机 械 鲁 盘 Chard disk drive, HDD) 的 历史 始 于 1956 年 ， 这 一 年 ， 世 界 上 第 一 个 磁 
盘存 储 系统 IBM 305 RAMAC 由 IBM 公司 发 明 ， 它 拥有 50 个 24 英寸 的 盘 片 ， 重 约 1 
吨 ， 容 量 为 SMB。1973 年 ，IBM 研制 成 功 了 一 种 新 型 的 硬盘 IBM 3340。 这 种 硬盘 拥有 
几 个 同 轴 的 金属 盘 片 ， 盘 片上 涂 着 磁性 材料 。 它 们 和 可 以 移动 的 磁头 共同 密封 在 一 个 盒 
子 里 面 ， 磁 头 能 从 旋转 的 盘 片上 读 出 磁 信 号 的 变化 。 这 就 是 我 们 今天 使 用 的 硬盘 最 接近 
的 祖先 ，IBM 把 它 叫 作 温 彻 斯 特 硬盘 。 因 为 IBM 3340 拥有 两 个 30MB 的 存储 单元 ， 而 
当时 一 种 很 有 名 的 “ 温 彻 斯 特 来 复 枪 ”的 口径 和 装 药 也 恰好 包含 了 两 个 数字 “30”。 于 是 
这 种 硬盘 的 内 部 代号 就 被 定 为 “ 温 彻 斯 特 ”。1980 年 ， 希 捷 (Seagate) 公司 制造 出 了 个 
人 计算 机 上 的 第 一 块 温 彻 斯 特 硬 盘 ， 这 个 硬盘 与 当时 的 软驱 体积 相仿 ， 容 量 为 SMB。 

硬盘 的 读 取 速 度 在 当时 受到 硬盘 转速 的 限制 。 提 高 转速 可 以 加 快 存 取 数据 的 速度 ， 
但 人 硬盘 的 磁头 与 盘 片 是 相互 接触 的 ， 过 高 的 转速 会 使 磁盘 容易 损坏 。 于 是 技术 人 员 想 到 
让 磁头 在 盘 片 上 方 “飞行 ?>。 盘 片 高 速 旋 转 会 产生 流动 的 风 ， 因 此 只 要 磁头 的 形状 合适 ， 
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它 就 能 像 飞 机 一 样 在 磁盘 表面 飞行 ， 盘 片 就 能 快速 旋转 而 不 必 担 心 磨 探 造 成 的 灾难 。 这 
就 是 温 彻 斯 特技 术 。 

温 彻 斯 特 硬 盘 采 用 了 创新 的 技术 ， 磁 头 被 固定 在 一 个 能 沿 盘 片 径 癌 运动 的 臂 上 ， 磁 
头 并 不 与 盘 片 接触 。 当 盘 片 与 磁头 相对 运动 时 ， 人 磁头 能 感应 到 盘 片 表面 的 磁极 ， 并 记录 
或 改变 磁极 的 状态 完成 数据 的 读 写 。 由 于 磁头 相对 盘 片 高 速 运动 ， 并 且 二 者 距离 很 近 ， 
这 时 候 哪 怕 是 一 粒 灰 竺 也 会 造成 磁盘 的 损坏 ， 因 此 硬盘 需要 封装 在 一 个 密封 的 盒子 里 ， 
从 而 维护 一 个 清洁 的 内 部 环境 ， 保 证 磁头 和 盘 片 能 高 效 可 靠 地 工作 。 

在 现代 的 计算 机 系统 中 ， 常 见 的 存储 介 = 
质 有 和 硬盘、 光盘、 磁带 、 固 态 硬 盘 等 。 便 盘 
WAKA. MIRRE AGERE RD UL, ASE 
性 高 ， 有 着 其 他 存储 介质 无 法 蔡 代 的 作用 ， 


一 代 硬 盘 和 现代 人 硬盘 如 图 2-3 所 示 。 
2. 机械 硬盘 的 组 成 
我 们 通常 所 说 的 硬盘 是 指 机 械 硬盘 ， 如 
图 2-4 所 示 ， 它 主要 由 盘 片 和 主轴 组 件 、 浮 ”图 2-3 第 一 代 硬 盘 ( 左 ) 和 现代 硬盘 ( 右 ) 
动 磁头 组 件 、 磁 头 驱动 机 构 、 前 驱 控 制 电 路 和 接口 等 组 成 。 
磁头 驱动 机 构 磁盘 片 





前 驱 控制 电路 





浮动 磁头 组 件 ”主轴 组 件 
图 2-4 ”硬盘 的 组 成 


C1) 盘 片 和 主轴 组 件 。 盘 片 和 主轴 组 件 是 两 个 紧密 相连 的 部 分 。 盘 片 是 一 个 圆 形 的 
薄片 ， 上 面 涂 了 一 层 磁 性 材料 以 记录 数据 。 主 轴 由 主轴 电机 驱动 ， 带 动 盘 片 高 速 旋转 。 

(2) 浮动 磁头 组 件 。 浮 动 磁 头 组件 由 读 写 磁头 、 传 动手 臂 和 传动 轴 3 部 分 组 成 。 在 盘 
片 高 速 旋 转 时 ,传动 手臂 以 传动 轴 为 圆心 带动 前 端的 读 写 磁头 在 盘 片 旋转 的 垂直 方向 上 移 
动 , 磁头 感应 盘 片 上 的 磁 信 号 来 读 取 数 据 或 改变 磁性 涂料 的 磁性 , 以 达到 写 入 信息 的 目的 。 

(3) 磁头 驱动 机 构 。 由 磁头 驱动 小 车 、 电 机 和 防震 机 构 组 成 。 其 作用 是 对 磁头 进行 
驱动 和 高 精度 的 定位 ， 使 磁头 能 迅速 、 准 确 地 在 指定 的 磁道 上 进行 读 写 工作 。 

(4) 前 驱 控 制 电路 。 前 驱 控 制 电路 是 密封 在 屏蔽 腔 体 以 内 的 放大 线路 ， 主 要 作用 是 
控制 磁头 的 感应 信号 、 主 轴 电 机 调 速 、 驱 动 磁 头 和 伺服 定位 等 。 

(5) 接口 。 通 常 包含 电源 接口 与 数据 传输 接口 。 目 前 主流 的 接口 类 型 有 SATA 和 SAS， 
稍 后 会 详细 介绍 。 
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3 机械 硬 盘 的 工作 原理 

机 械 人 硬盘 存储 数据 ， 是 根据 电 、 磁 转换 的 原理 来 实现 的 。 

硬盘 内 部 用 于 存储 数据 的 盘 片 ， 是 一 张 表面 涂 有 磁性 材料 的 金属 圆 盘 。 盘 片 表面 被 
划分 出 一 圈 圈 磁道 ， 当 盘 片 在 马达 的 驱动 下 高 速 旋转 时 ， 设 置 在 盘 片 表面 的 磁头 便 受 到 
精确 的 控制 ， 沿 着 磁道 读 取 和 写 入 数据 。 当 系统 向 硬盘 写 入 数据 时 ， 磁 头 中 便 产 生 随 着 数 
据 内 容 而 变化 的 电流 ， 这 股 电流 会 产生 磁场 ， 使 盘 片 表面 磁性 物质 的 状态 改变 ， 并 且 这 一 
状态 在 电流 磁场 消失 后 仍 能 持久 地 保持 下 来 ， 这 就 相当 于 将 数据 保存 了 下 来 。 当 系统 从 硬 
盘 中 读 取 数据 时 ， 磁 头 经 过 盘 片 指定 区 域 ， 盘 片 表 面 的 磁场 使 磁头 产生 感应 电流 或 线圈 阻 
抗 产生 变化 ， 这 一 变化 被 捕捉 下 来 ， 经 过 一 定 的 处 理 ， 便 能 够 还 原 出 原本 写 入 的 数据 。 

4. 机 械 硬 盘 的 类 型 

机 械 人 硬盘 按 接口 的 不 同 可 分 为 不 同 的 类 型 , 目前 比较 流行 的 有 SATA 接口 硬盘 、SAS 
接口 硬盘 等 几 种 。 由 于 接口 决定 了 数据 传输 方式 ， 对 硬盘 的 性 能 有 着 巨大 的 影响 ， 所 以 
一 直 受 到 人 们 的 关注 。 下 面 将 一 一 分 析 这 些 接口 类 型 。 

5. SATA 接口 硬盘 

说 到 SATA， 首 先 要 从 ATA (advanced technology attachment) 接口 说 起 。ATA 接口 
实际 上 就 是 我 们 常 说 的 IDE (integrated drive electronics) 接口 。ATA 接口 从 20 世纪 80 
年 代 一 直 发 展 至 今 ， 且 由 于 其 价格 低 、 兼 容 性 好 ， 曾 经 是 市 场 上 的 主流 配置 。 但 随 着 时 
代 的 发 展 ， 其 速度 过 慢 ， 已 不 足以 应 用 在 现代 计算 机 系统 中 。 

SATA, 即 串 行 ATA (serial ATA), 如 图 2-5 Prax, 现 已 基本 取代 所 有 并 行 ATA 接口 。 
顾名思义 ，SATA 使 用 串 行 的 方式 发 送 数据 。SATA 的 显著 特点 就 是 比 ATA 快 ， 目 前 普 
及 的 SATA 3.0 可 达 6.0Gbit/s 的 传输 速率 ， 是 并 行 ATA 标准 的 数 倍 。 





图 2-$ SATA 接口 


在 传输 数据 时 ，SATA 使 用 独立 的 数据 接口 和 信号 接口 。 并 行 ATA 在 传输 时 使 用 16 
位 的 数据 总 线 ， 并 且 需 要 传输 许多 附加 的 支持 和 控制 信号 。 又 因为 工艺 的 限制 ， 易 受 品 
音 影 响 ， 需 要 使 用 5V 电压 才能 工作 。 与 之 相对 应 ，SATA KRAMRARN Ea Ss, AAT 
更 强 的 纠 错 能 力 ， 且 只 需要 使 用 0.5V 的 电压 即 可 工作 。 

从 总 线 结构 上 看 ，SATA 使 用 单 通道 进行 点 对 点 的 传输 ， 其 中 以 串 行 方式 按 位 传输 ， 
数据 中 典 入 了 校 验 和 信和 号 位 。 这 种 传输 方式 既 能 保证 速度 ， 又 能 提高 数据 传输 的 可 靠 性 。 
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SATA 硬盘 采用 点 对 点 连接 方式 , LIFA 
插 拔 ， 即 插 即 用 。SATA 接口 通常 为 7+15 Ft, 
与 并 行 ATA 相 比 ，SATA 使 用 较 细 的 线 缆 ， 
便于 弯曲 ， 同 时 最 长 可 达 lm， 极 大 地 改善 了 
机 箱 内 的 散热 .SATA 接口 硬盘 如 图 2-6 所 示 。 

6. SAS 接口 硬盘 

SAS (serial attached SCSI)， 即 串 行 连接 
SCSI (small computer system interface， 小 型 
计算 机 系统 接口 )。 与 SATA Bil, SAS 也 是 an 
从 对 应 的 并 行 SCSI 技 术 发 展 而 来 。 i 26 | SATA ASE 

SCSI 以 其 高 性 能 常常 应 用 于 企业 级 存储 领域 。SCSI 硬盘 分 为 50 F~ 68 EF. 80 FT, 
历经 数 十 年 的 发 展 ， 当 前 主流 的 SCSI 技术 Ultra 320 SCSI 支持 320MB/s 的 传输 速度 。 在 
存储 网 络 部 分 有 对 SCSI 协议 的 详细 介绍 。 

SAS 作为 SCSI 技术 的 分 文 ， 与 SATA 类 似 ， 通 过 采用 串 行 传输 以 得 到 更 高 的 性 能 ， 
目前 主流 的 SAS 传输 速率 为 6Gbitfs。 同 时 由 于 采用 串 行 技术 可 以 使 用 细 而 长 的 线 绩 ， 
不 仅 可 以 实现 更 长 的 连接 距离 ， 还 能 够 提高 抗 干扰 能 力 。SAS 接口 正 反 面 如 图 2-7 所 示 。 








正面 图 反面 图 
图 2-7 SAS 接口 正 反 面 图 


SAS 同 下 兼容 SATA, SAS 控制 器 可 以 与 SATA 硬盘 相连 接 ， 这 为 企业 提供 了 低 成 
本 和 优秀 的 灵活 性 。 

在 传输 方式 上 ，SAS 采用 点 对 点 连接 方式 。 与 SATA 类 似 ，SAS 不 像 并 行 SCSI 一 
样 需要 终止 信号 ， 也 不 会 出 现 同步 问题 。SAS 
最 多 可 以 支持 65 5536 个 设备 ， 不 像 SCSI 只 能 
| 文 持 8 个 或 16 个 设备 。 

SAS 接口 硬盘 价格 相对 更 高 。 

有 一 种 称 作 NL SAS 的 硬盘 ， 是 采用 SAS 
接口 和 SATA 级 盘 体 组 成 的 硬盘 , 如 图 2-8 所 示 。 
虽然 可 接 入 SAS 网 络 ， 但 性 能 达 不 到 SAS 的 
要 求 。 近 线 (near line, NL) 是 一 种 介 于 在 线 
存储 和 离线 存储 之 间 的 存储 方式 。NL SAS fi 
盘 一 般 使 用 在 SAS 网 络 中 ， 用 于 存放 大 量 不 常用 的 数据 。 

7. FC 接口 硬盘 

FC 便 盘 定位 于 高 端 存储 应 用 ， 具 有 较 高 的 可 靠 性 和 性 能 。 光 纤 通 道 (fiber channel, 





2-8 NL-SAS 接口 
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FC) 是 一 种 高 速 的 数据 传输 介质 。FC 硬盘 采用 光纤 通道 仲裁 环 (fiber channel arbitrated 
loop, FC-AL) 标准 ， 人 允许 在 一 个 多 达 126 台 设 备 的 环 路 中 进行 高 速 的 串 行 传输 ， 支 持 
热 插 拔 。 
FC 网 络 具有 很 好 的 可 扩展 性 ， 使 用 光纤 电线 连接 ， 范 围 达到 10km. FC 网 络 具 有 非常 高 
的 带宽 , 适用 于 高 端 应 用 ,如 大 型 数据 中 心 。 FC 协议 的 细节 将 在 存储 网 络 部 分 中 进一步 讲解 。 
FC 网 络 的 主要 缺点 在 于 价格 非常 昂贵 ， 并 且 网 络 组 建 复杂 。 


8. 硬盘 接口 比较 
常见 硬盘 接口 比较 如 表 2-1 所 示 。 
表 2-1 常见 硬盘 接口 比较 
性 能 非常 高 
可 靠 性 非常 高 
价格 非常 贵 
Ai 高 
适合 数据 较为 离 | 适合 较 大 数据 块 、| 适合 大 数据 块 、 业 适合 高 端 用 户 , 频 
推荐 场景 散 的 高 /中 端 用 户 | 业务 压力 不 大 的 | 务 压力 不 大 的 用 繁 访问 的 数据 
使 用 用 户 使 用 户 使 用 


9. 机械 硬盘 性 能 

机 械 硬 盘 的 性 能 是 由 许多 因素 共同 决定 的 ， 而 其 中 最 重要 的 是 硬盘 的 单 碟 容量 、 转 
速 和 缓存 。 这 些 因素 最 终 体 现在 硬盘 的 访问 时 间 以 及 数据 传输 速率 这 两 个 指标 上 。 

10. 硬盘 的 单 碟 容 量 

单 碟 容量 是 硬盘 相当 重要 的 参数 之 一 ， 在 一 定 程度 上 决定 硬盘 的 档次 高 低 。 硬 盘 是 
由 多 个 存储 碟 片 〈 即 上 文 所 说 的 盘 片 ) 组 合 而 成 的 ， 而 单 碟 容量 就 是 一 个 存储 碟 片 所 能 
存储 的 最 大 数据 量 。 

提升 单 碟 容量 可 以 提升 硬盘 单位 体积 的 容量 ， 而 且 也 有 利于 控制 生产 成 本 ， 提 高 硬盘 工 
作 的 稳定 性 。 单 碟 容 量 的 增加 意味 着 厂商 要 在 同样 大 小 的 盘 片 上 建立 更 多 的 磁道 数 〈 数 据 存 
储 在 盘 片 的 磁道 中 )， 虽 然 这 在 技术 难度 上 对 厂商 要 求 很 高 ， 但 盘 片 磁道 密度 〈 单 位 面积 上 的 
磁道 数 ) 提高 ， 代 表 数 据 密度 的 提高 ， 这 样 在 硬盘 工作 时 ， 盘 片 每 转动 一 周 ， 磁 头 所 能 读 出 
的 数据 就 越 多 ， 所 以 在 相同 转速 的 情况 下 ， 人 硬盘 单 碟 容 量 越 大 ， 其 内 部 数据 传输 速率 就 越 快 。 
另外 单 碟 容 量 的 提高 使 单位 面积 上 的 磁道 条 数 也 有 所 提高 ， 这 样 硬 盘 寻 道 时 间 也 会 有 所 下 降 。 

如 今 ， 便 盘 的 单 碟 容 量 已 经 达到 TB 级 别 。 

11. 硬盘 的 转速 

转速 (rotational speed) 是 指 硬盘 内 的 盘 片 在 一 分 钟 内 所 能 完成 的 最 大 旋转 圈 数 ， 它 
也 是 标识 硬盘 档次 的 重要 参数 之 一 。 

当 硬 盘 读 写 数 据 时 ， 人 硬盘 的 主轴 马达 带动 盘 片 高 速 旋 转 ， 将 所 要 存 取 资 料 的 扇 区 带 到 
磁头 下 方 。 硬 盘 转 速 越 快 ， 则 等 待 的 时 间 就 会 越 少 ， 并 且 磁 头 扫 过 盘 片 的 速度 也 就 更 快 ， 读 
取 数 据 的 速度 就 更 高 。 因 此 转速 在 很 大 程度 上 决定 了 硬盘 的 性 能 。 但 是 , 转速 的 提升 也 意味 
着 技术 要 求 更 为 苛刻 ， 以 及 硬盘 功 耗 的 增加 ， 因 此 硬盘 的 转速 难以 得 到 非常 大 的 提升 。 

硬盘 转速 的 单位 为 转 / 分 钟 (revolutions per minute，RPM)。 目 前 个 人 计算 机 的 硬盘 
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转速 普遍 为 7 200rmin， 用 于 服务 器 领域 的 硬盘 则 可 达 15 000r/min. 

转速 是 随 厦 硬盘 电机 的 改变 而 提高 的 。 现 在 液态 轴承 马达 (fluid dynamic bearing 
motors) 已 全 面 代替 了 传统 的 滚珠 轴承 马达 。 液 态 轴承 马达 通常 应 用 于 精密 机 械 工 业 上 ， 
它 使 用 的 是 黏膜 液 油 轴 承 ， 以 油膜 代替 滚珠 ， 这 样 可 以 避免 金属 面 直 接 摩擦 ， 将 噪声 
及 温度 减 至 最 低 ; 同时 油膜 可 有 效 吸收 震动 ， 使 抗震 能 力 得 到 提高 ; 更 可 减少 磨损 ， 
提高 寿命 。 

12. 硬盘 缓存 

RTT (cache memory) 是 硬盘 控制 器 上 的 一 块 内 存世 片 ， 具 有 极 快 的 存 取 速 度 ， 它 
是 硬盘 内 部 存储 和 外 界 接口 之 间 的 缓冲 器 。 

由 于 磁盘 的 读 写 速度 远 远 比 不 上 计算 机 内 存 的 读 写 速度 ， 因 此 让 数据 直接 在 磁盘 与 
内 存 之 间 传 输 ， 会 让 内 存 长 时 间 处 于 低 效 状态 ， 拖 累 其 效率 。 这 时 候 ， 缓 存 可 以 发 挥 作 
H: 当 操 作 系统 给 便 盘 读 取 指 令 后 ， 便 盘 便 开始 将 数据 存 入 缓存 ， 等 存 到 一 定量 数据 时 ， 
再 通知 操作 系统 从 缓存 中 读 取 。 而 对 于 写 操作 , 则 可 以 让 操作 系统 直接 将 数据 写 入 缓存 ， 
之 后 再 逐步 从 缓存 迁移 到 磁盘 上 。 由 于 缓存 的 读 写 速度 和 内 存 接近 ， 远 比 磁盘 要 快 ， 从 
而 使 计算 机 能 用 最 少 的 时 间 与 硬盘 进行 交互 ， 而 数据 在 缓存 与 磁盘 之 间 传 输 时 ， 操 作 系 
统 完 全 可 以 切换 到 其 他 任务 ， 从 而 提高 整个 系统 的 效率 。 

此 外 ， 计 算 机 中 普遍 存在 的 数据 局 部 性 〈data locality) 现象 ， 使 得 缓存 可 以 提高 硬 
盘 的 响应 速度 。 数 据 局 部 性 主要 体现 在 以 下 两 个 方面 。 

e 时 间 局 部 性 (temporal locality): 一 个 被 访问 的 数据 ， 在 短 时 间 内 有 较 大 可 能 被 

再 次 访问 。 i 
e 空间 局 部 性 (spatial locality): 一 个 被 访问 的 数据 ， 其 周围 的 数据 在 短 时 间 内 有 
较 大 可 能 被 访问 。 

利用 数据 局 部 性 ， 可 以 采用 两 种 策略 来 提高 性 能 。 一 种 是 将 最 近 被 读 取 的 数据 尽 可 
能 留 在 缓存 中 ， 当 再 次 访问 相同 的 地 址 时 ， 便 可 以 直接 在 缓存 中 读 取 。 另 一 种 是 当 访 问 
一 个 数据 块 时 ， 将 其 周围 的 数据 块 也 一 并 载 入 缓存 ， 这 称 为 预 读 取 。 这 样 ， 之 后 如 果 访 
问 临近 的 数据 块 便 可 以 直接 在 缓存 中 找到 。 通 过 这 两 种 策略 ， 应 用 程序 可 以 更 快 地 从 硬 
盘 获 取 到 所 需 的 数据 ， 从 而 提高 运行 效率 。 

通常 来 说 ， 采 用 更 大 的 缓存 可 以 提高 硬盘 的 访问 速度 ， 但 是 采用 优秀 的 缓存 替换 算 
法 同样 重要 ， 因 为 缓存 的 空间 相 比 于 硬盘 来 说 非常 有 限 ， 好 的 算法 可 以 让 更 常用 的 数据 
留 在 缓存 中 ， 使 尽 可 能 多 的 硬盘 访问 直接 在 缓存 中 找到 数据 。 

13. 硬盘 的 访问 时 间 

(1) 平均 寻 道 时 间 (average seek time): 指 硬盘 在 接收 到 系统 指令 后 ， 磁 头 从 开始 
移动 到 移动 至 数据 所 在 磁道 花费 时 间 的 平均 值 ， 它 在 一 定 程度 上 体现 硬盘 读 取 数 据 的 能 
力 ， 是 影响 硬盘 内 部 数据 传输 率 的 重要 参数 。 平 均 寻 道 时 间 的 单位 为 ms。 

在 鲁 盘 上 ， 数 据 是 分 磁道 、 分 簇 存 储 的 ， 长 时 间 的 读 写 操作 后 ， 数 据 往 往 并 不 是 
连续 排列 在 同一 磁道 上 ,所 以 磁头 在 读 取 数据 时 需要 在 磁道 之 间 反 复 移动 ， 因 此 平均 
寻 道 时 间 对 硬盘 读 写 速度 有 显著 影响 。 在 通常 情况 下 ， 硬 盘 在 读 写 大 量 的 小 文件 时 ， 
平均 寻 道 时 间 也 起 着 至 关 重 要 的 作用 ; 在 读 写 大 文件 或 连续 存储 的 大 量 数据 时 , 平均 
寻 道 时 间 的 对 读 写 速度 的 影响 较 小 ， 此 时 单 碟 容量 的 大 小 、 转 速 、 缓 存 就 是 较为 重要 
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的 因素 。 

(2) 平均 延迟 时 间 (average latency time): 指 当 磁 头 移动 到 数据 所 在 的 磁道 后 ， 等 
待 所 要 的 数据 块 继续 转动 到 磁头 下 的 时 间 , 盘 片 转动 速度 越 快 , 平均 延迟 时 间 也 就 越 短 。 
平均 延迟 时 间 的 单位 为 ms。 

(3) 平均 访问 时 间 (average access time): 指 磁 头 找到 指定 数据 的 平均 时 间 ， 通 常 是 
平均 寻 道 时 间 与 平均 延迟 时 间 之 和 。 平 均 访 问 时 间 最 能 够 代表 硬盘 找到 某 一 数据 所 用 的 
时 间 ， 平 均 访 问 时 间 越 短 越 好 。 平 均 访 问 时 间 的 单位 为 mso 

14. 硬盘 的 数据 传输 率 

硬盘 的 数据 传输 性 能 指标 主要 分 为 外 部 数据 传输 率 〈external data transfer rate) 和 内 
部 数据 传输 率 (internal data transfer rate) 两 种 。 

外 部 数据 传输 率 ， 是 指 计算 机 通过 数据 总 线 从 硬盘 内 部 缓存 区 中 所 读 取 数 据 的 最 高 
速率 ， 也 叫 突 发 数据 传输 率 (burst data transfer rate)。 该 参数 标 称 的 是 系统 总 线 与 硬盘 组 
冲 区 之 间 的 数据 传输 率 ， 外 部 数据 传输 率 与 硬盘 接口 类 型 和 硬盘 缓存 的 大 小 有 天。 

内 部 数据 传输 率 ， 是 指 硬盘 磁头 与 缓存 之 间 的 数据 传输 率 ， 简 单 的 说 就 是 硬盘 将 数 
据 从 盘 片 上 读 取 出 来 ， 然 后 存储 在 缓存 内 的 速度 。 内 部 传输 率 可 以 明确 表现 出 硬盘 的 读 
写 速 度 ， 它 的 高 低 才 是 评价 一 个 硬盘 整体 性 能 的 决定 性 因素 ， 它 是 衡量 硬盘 性 能 的 真正 
标准 。 只 有 有 效 提高 硬盘 的 内 部 传输 率 ， 才 能 对 磁盘 子 系统 的 性 能 有 最 直接 、 最 明显 的 
提升 。 提 高 硬盘 的 内 部 传输 率 ， 除 了 改进 信号 处 理 技术 、 提 高 转速 以 外 ， 最 主要 的 就 是 
不 断 提高 单 碟 容 量 以 提高 线性 密度 。 由 于 单 碟 容量 越 大 ， 硬 盘 线性 密度 越 高， 磁头 的 寻 
道 频率 与 移动 距离 可 以 相应 的 减少 ， 从 而 减少 了 平均 寻 道 时 间 ， 内 部 传输 速率 也 就 提高 
了 。 虽 然 硬 盘 技 术 发 展 得 很 快 ， 但 内 部 数据 传输 率 还 是 在 一 个 比较 低 〈 相 对 ) 的 层次 上 ， 
内 部 数据 传输 率 低 已 经 成 为 硬盘 性 能 的 最 大 瓶颈 。 

数据 传输 率 的 单位 一 般 采 用 MB/s 或 Mbits， 尤 其 在 内 部 数据 传输 率 上 ， 官 方 数据 
中 更 多 的 采用 Mbit/s 为 单位 。 但 这 两 个 单位 之 间 有 很 大 的 差异 : MB/s 的 含义 是 兆 字 节 
每 秒 ，Mbit/s 的 含义 是 兆 比特 每 秒 ， 前 者 是 指 每 秒 传 输 的 字 节 数量 ， 后 者 是 指 每 秒 传输 
的 比特 位 数 。MB/s 中 的 B 字母 是 Byte WAM, Byte 是 字 节 数 ，bit 是 位 数 ， 也 就 是 比特 
数 。 在 计算 机 中 每 8 位 (比特 ) 为 一 字 节 ， 也 就 是 1 Byte 二 8bit， 是 1 : 8 的 对 应 关系 。 这 
是 一 般 情况 下 MB/s 与 Mbit/s 的 对 应 关系 ， 但 在 硬盘 的 数据 传输 率 上 二 者 就 不 能 用 一 般 
的 MB 和 Mbit 的 换算 关系 〈1B=8bit) 来 换算 。 因 为 在 磁头 处 理 的 信号 很 大 部 分 并 不 是 
用 户 需要 的 数据 〈 存 入 的 数据 都 是 经 过 编码 的 ,包含 许多 辅助 信息 )， 因 此 不 能 以 字 节 为 
单位 。 简 单 地 用 8 来 换算 ， 将 无 法 得 到 真实 的 内 部 数据 传输 率 。 


2.2.2 ”固态 硬盘 


L 固态 硬盘 的 产生 、 发 展 和 趋势 

世界 上 第 一 款 固态 硬盘 (solid state drive, SSD) 出现 于 1989 年 。 当 时 的 固态 硬盘 
价格 极为 昂贵 ， 但 在 性 能 上 却 远 低 于 当时 的 普通 硬盘 ， 因 此 没有 得 到 广泛 应 用 ， 但 由 于 
固态 硬盘 独 有 的 抗震 、 静 音 、 低 功 耗 等 特性 ， 却 能 应 用 于 非常 特别 的 市 场 ， 如 医疗 工作 
以 及 军用 市 场 ， 因 此 在 这 些 领域 ， 固 态 硬 盘 得 到 了 一 定 程度 的 发 展 。 

随 着 固态 硬盘 技术 的 日 趋 成 熟 、 制 造 工艺 的 提升 、 生 产 成 本 的 降低 ， 它 开始 逐渐 进 


24 信息 存储 与 IT 管理 


入 消费 领域 。2006 E, 三 星 发 布 了 第 一 球 带 有 32GB 固态 硬盘 的 笔记 本 电脑 。2007 年 初 ， 
SanDisk 发 布 了 两 款 32GB 的 固态 硬盘 产品 。2011 年 ， 泰 国 发 生 大 洪水 ， 诸 多 机 械 硬盘 
厂商 诸如 西部 数据 、 希 捷 等 ， 在 泰国 的 工厂 都 被 迫 关闭 ， 导 致 当年 机 械 硬 盘 产 量 大 幅 下 
降 ， 价 格 猛 增 。 这 在 很 大 程度 上 刺激 了 人 们 对 固态 硬盘 的 需求 ， 从 而 带 来 了 固态 硬盘 的 
黄金 时 期 。 如 今 ， 固 态 硬盘 在 容量 、 成 本 、 传 输 速 率 以 及 使 用 寿命 上 ， 相 比 于 最 初 的 产 
品 ， 都 有 了 极 大 的 提升 。 现 在 市 场 上 常见 的 固态 硬盘 的 容量 已 经 达到 128GB 一 256GB， 
而 每 GB 的 价格 只 有 当时 的 几 分 之 一 ， 让 很 多 消费 者 都 能 承担 得 起 。 在 超 薄 笔记 本 与 平 
板 领域 ， 固 态 硬盘 更 是 必 不 可 少 的 存储 设备 之 一 。 可 以 预见 ， 在 未 来 儿 年 ， 固 态 硬 械 仍 
将 受到 人 们 的 极 大 关注 。 

固态 硬盘 由 主 控 芯 片 和 存储 芯片 组 成 ， 简 单 地 说 ， 就 是 用 固态 电子 芯片 阵列 构成 的 
人 硬盘。 固态 硬盘 的 接口 规范 、 定 义 、 功 能 及 使 用 方法 与 普通 硬盘 的 完全 相同 ， 在 产品 外 
形 和 尺寸 上 也 完全 与 普通 硬盘 一 致 ， 包 插 3.5'、2.5'、1.8' 多 
种 类 型 。 由 于 固态 硬盘 没有 普通 硬盘 的 旋转 结构 ， 因 而 抗震 
性 极 佳 ， 同 时 工作 温度 范围 很 大 ， 扩 展 温度 的 电子 硬盘 可 工 
作 在 -45SC 一 +8SC， 广 泛 应 用 于 军事 、 车 载 、 工 控 、 视 频 监 
控 、 网 络 监 控 、 网 络 终端 、 电 力 、 医 疗 、 航 空 、 导 航 设 备 等 
领域 。 传 统 机 械 人 硬盘 都 是 磁 碟 型 的 ， 数 据 就 储存 在 磁盘 肩 区 
里 ,而 常见 的 固态 硬盘 的 存储 介质 是 内 存 〈Flash)。 固 态 人 硬盘 
是 未 来 硬盘 发 展 的 趋势 之 一 。 固 态 硬盘 示意 图 如 图 2-9 所 示 。 

2. 固态 硬盘 组 成 | nig, at 

固态 硬盘 由 主 控 芯 片 、 存 储 芯片 构成 。 存 储 芯 片 负责 存 \ 
放 数 据 ， 主 控 忌 片 则 控制 数据 的 读 / 写 过 程 协调 。 存 储 芯片 按 i 
介质 分 为 两 种 ,最 常见 的 一 种 是 采用 闪存 (Flash 芯片 ) 作为 图 2-9 固态 硬盘 示意 图 
存储 介质 ， 另 一 种 是 采用 动态 随机 存 取 存储 器 (DRAM) 作为 存储 介质 。 

C) 基于 闪存 的 固态 硬盘 

最 为 常见 的 固态 硬盘 采用 闪存 芯片 作为 存储 介质 。 闪 存 芯 片 根据 使 用 方式 不 同 ， 可 
以 被 制作 成 多 种 电子 产品 ， 如 固态 硬盘 、 存 储 卡 、U 盘 等 ， 这 些 设 备 都 具有 体积 小 、 便 
携 性 高 等 特点 。 本 章节 所 讨论 的 固态 硬盘 ， 都 是 基于 闪存 的 固态 硬盘 。 

(2) 基于 DRAM 的 固态 硬盘 

这 一 类 固态 硬盘 采用 DRAM (动态 随机 存 取 存 储 器 ) 作为 存储 介质 。 这 种 存储 介质 
目前 广泛 应 用 于 内 存 ， 性 能 非常 好 ， 而 且 使 用 寿命 很 长 。 美 中 不 足 的 是 ， 它 只 有 在 供电 
状态 下 才能 保存 数据 ， 一 旦 失去 供电 ，DRAM 存储 的 信息 就 会 丢失 ， 因 此 它 需 要 额外 的 
电源 来 保护 。 目 前 这 类 固态 硬盘 价格 很 高 ， 应 用 范围 较 罕 。 

相 比 于 传统 硬盘 ， 固 态 硬盘 在 很 多 方面 都 更 具 优 势 。 

G) 读 取 速 度 快 。 由 于 固态 硬盘 是 以 闪存 芯片 为 介质 ， 没 有 磁盘 与 马达 的 结构 ， 因 
此 在 读 取 数据 时 节省 了 寻 道 时 间 ， 在 随机 读 取 时 尤其 能 体现 速度 的 优势 。 同 时 ， 固 态 硬 
盘 的 性 能 不 会 受到 磁盘 碎片 的 影响 。 

(4) 抗震 性 好 。 固 态 硬盘 内 部 不 存在 任何 机 械 活动 部 件 ， 不 会 发 生机 械 故 障 ， 也 不 怕 
碰撞 、 冲 击 、 振 动 。 这 样 即 使 在 高 速 移动 ， 甚 至 伴随 翻转 倾斜 的 情况 下 ， 也 不 会 影响 到 正常 
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使 用 ， 而 且 在 笔记 本 电脑 意外 掉 落 或 与 硬 物 碰撞 时 ， 能 够 将 数据 丢失 的 可 能 性 降 到 最 小 。 

(5) 无 噪音 。 固 态 硬盘 内 部 没有 机 械 马 达 ， 因 此 是 真正 的 无 噪音 静音 硬盘 。 

(6) 体积 小 ， 重 量 轻 。 一 块 很 小 的 电路 板 上 就 可 以 集成 一 块 固 态 硬盘 。 

(7) 工作 温度 范围 更 大 。 典 型 的 硬盘 驱动 器 只 能 在 SC 一 $5$5C 范 围 内 工作 。/ 而 大 多 
数 固态 硬盘 可 在 -10C=~70C 温 度 范 围 内 工作 ， 一 些 工 业 级 的 固态 硬盘 还 可 在 -40C 一 
85'C， 甚 至 更 大 的 温度 范围 下 工作 。 

然而 固态 硬盘 也 有 两 个 很 大 的 缺点 ， 导 致 它 目前 无 法 成 为 机 械 硬 盘 的 替代 品 。 一 个 
缺点 是 成 本 较 高 。 目 前 固态 硬盘 每 单位 容量 的 价格 是 传统 硬盘 的 10 倍 左右 , 大 容量 固态 
人 硬盘 在 市 场 上 仍然 相当 少见 ， 因 此 对 于 那些 对 数据 读 写 速度 不 敏感 的 应 用 ， 机械 硬盘 仍 是 
第 一 选择 。 另 一 个 缺点 是 固态 硬盘 的 寿命 有 限 , 一般 高 性 能 的 闪存 可 以 擦 除 1 万 一 10 万 次 ， 
普通 消费 级 的 内 存 只 能 擦 除 3 千 一 3 万 次 。 随 着 制造 工艺 的 不 断 提升 ， 存 储 单元 的 尺寸 越 
做 越 小 ， 闪 存 的 最 大 探 除 次 数 还 将 进一步 降低 。 好 在 通常 情况 下 ， 固 态 硬盘 的 主 控 忆 片 都 
具有 平衡 已 片 损耗 的 功能 ， 可 以 使 存储 芯片 更 加 均匀 地 被 消耗 ， 从 而 提高 使 用 寿命 。 

固态 硬盘 作为 相 比 于 传统 硬盘 拥有 更 高 读 写 速度 的 存储 介质 ， 如 今 已 受到 人 们 的 广 
泛 关 注 。 由 于 其 原理 与 传统 硬盘 不 同 ， 没 有 任何 机 械 的 成 分 ， 因 此 固态 硬盘 在 性 能 上 提 
升 很 快 ， 同 时 它 还 具有 抗震 、 体 积 小 、 无 噪音 、 散 热 小 等 传统 硬盘 不 具有 的 优点 ， 因 此 
被 很 多 人 寄 于 希望 取代 传统 硬盘 ， 成 为 新 一 代 的 存储 设备 。 然 而 ， 固 态 硬盘 的 成 本 目前 
还 远 远 高 于 传统 硬盘 ， 加 之 现在 硬盘 的 性 能 已 经 能 满足 很 大 一 部 分 的 需求 ， 因 此 在 很 长 
一 段 时 间 内 ， 传 统 硬盘 与 固态 硬盘 还 将 共存 ， 共 同 发 展 。 

3. 固态 硬盘 的 工作 原理 

固态 硬盘 与 机 械 硬盘 采用 了 完全 不 同 的 存储 介质 ， 前 者 用 闪存 芯片 ， 后 者 用 磁盘 ， 
因而 它们 的 工作 原理 也 大 不 相同 。 

内 存心 片 内 最 小 的 存储 单元 叫 作 浮 栅 晶体 管 ， 是 一 种 尺寸 极 小 的 电子 元 件 。 这 是 一 
种 场 效 应 晶体 管 ， 它 有 源 极 、 漏 极 和 栅 极 ， 在 栅 极 下 面 有 一 个 浮 栅 (floating gate) 可 以 
长 久 地 存储 一 定数 量 的 电荷 ， 并 且 电 荷 数量 的 多 少 会 影响 晶体 管 源 极 和 漏 极 之 间 的 导 通 
效果 。 固 态 硬盘 通过 在 晶体 管 的 浮 栅 中 注入 不 同 数量 的 电子 ， 改 变 晶 体 管 的 导 通 效果 ， 
实现 不 同 状态 的 记录 和 识别 。 

读 取 数 据 时 ， 只 需 在 源 极 和 漏 极 之 间 加 一 个 电压 。 由 于 它们 之 间 的 导 通 性 受到 浮 栅 
中 电荷 量 的 影响 ， 因 此 通过 检测 导 通 的 电流 大 小 ， 就 可 以 识别 所 存储 的 数据 。 

在 写 入 数据 时 ， 首 先 需 要 将 晶体 管 浮 栅 中 的 电子 全 部 导出 ， 相 当 于 将 数据 全 都 置 为 

。 这 个 过 程 通常 也 叫 作 擦 除 。 接 下 来 ， 通过 在 咒 体 管 的 栅 极 和 漏 极 施加 高 电压 ,就 能 将 
ee 完成 0 的 数据 位 的 写 入 。 

有 一 点 很 特别 的 是 ， 闪 存 蕊 片上 的 读 、 写 、 擦 除 的 最 小 单位 是 不 同 的 。 闪 存 上 的 存 
储 空间 被 组 织 成 页 面 和 块 ， 一 个 页 面 (page) 的 大 小 通常 为 4 区 ， 而 一 个 块 (block) 通 
常 包 含 者 干 页 面 。 读 操作 可 以 对 任意 存储 单元 进行 ， 写 操作 一 次 会 写 整个 页 面 ， 擦 除 操 
作 一 次 会 擦 除 整 个 块 。 因此 在 固态 硬盘 的 操作 中 ， 擦 除 是 最 为 耗 时 的 ， 其 次 是 普通 写 入 ， 
而 读 取 则 非常 快 。 这 一 方式 还 带 来 更 多 问题 ， 由 于 固态 硬盘 内 的 读 取 、 写 入 、 擦 除 操 作 
无 法 简单 地 与 机 械 硬盘 的 读 入 、 写 入 操作 对 应 起 来 ， 操 作 系 统 无 法 用 操作 机 械 硬盘 的 方 
式 来 操作 固态 硬盘 。 因此, 固态 硬盘 内 部 还 需要 一 个 芯片 来 完成 这 两 套 操作 之 间 的 转换 。 
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还 有 一 点 与 传统 硬盘 不 同 的 是 ， 闪 存 芯 片 有 寿命 限制 ， 这 体现 在 其 存储 单元 只 能 进 
行 有 限 次 的 探 除 操作 , 超过 一 个 限度 就 会 使 存储 单元 变 得 不 可 靠 。 闪存 的 寿命 通常 以 P/E 
(program/erase) 为 单位 ， 其 含义 是 最 大 允许 的 探 除 次 数 。 和 典型 的 SLC 闪存 ， 其 存储 单 
元 只 记录 0. 1 两 种 状态 ， 它 的 寿命 为 1 万 一 10 万 次 P/E。 

4. 固态 硬盘 接口 

固态 硬盘 的 接口 类 型 多 元 ， 主 要 包括 SATA 接口 、mSATA 接口 和 PCI-E 接口 。 

(1) SATA 接口 

SATA (serial ATA) 已 经 是 一 种 非常 成 熟 的 技术 了 ， 从 2001 年 推出 SATA 1.0 到 目 
前 的 SATA 2.0 和 SATA 3.0, SATA 已经 成 为 目前 机 械 硬盘 的 主要 接口 。 而 固态 硬盘 也 顺 
其 自然 地 沿用 了 这 一 标准 , 从 而 能 更 广泛 地 应 用 于 现 有 的 设备 上 。SATA 3.0 高 达 600MB/s 
的 传输 速率 ， 已 经 能 满足 主流 SSD 的 传输 速度 需求 。 

(2) mSATA 接口 

mSATA 是 迷你 版 本 的 SATA 接口 , 使 用 Mini PCI-E 连接 器 传输 SATA 信号 。 它 可 支 
持 1.5Gbit/s、3Gbit/s 和 6Gbit/s 传输 模式 。mSATA 接口 多 用 于 固态 硬盘 ， 适 用 于 需要 尺 
寸 较 小 的 存储 器 的 场合 ， 如 超 薄 笔记 本 电脑 等 。mSATA 固态 硬盘 形似 Mini PCI-E 扩展 
卡 ， 尺 寸 很 小 ， 有 助 于 节省 机 器 内 部 空间 。 

(3) PCI-E 接口 

PCI Express (peripheral componentInterconnect express) 简称 PCI-E， 是 PCI 的 一 种 ， 
它 沿用 了 现 有 的 PCI 编程 概念 及 通信 和 标准， 但 基于 更 快 的 串 行 通信 系统 。 

第 一 代 PCI-E 可 支持 每 个 传输 通道 单 向 250MB/s 的 数据 传输 率 ， 而 一 个 16 通道 的 
PCI-E 卡 理论 上 单 向 可 以 达到 250*16=4 OOOMB/s. 随 着 PCI-E 接口 的 升级 , 第 四 代 PCLE 
接口 单个 通道 的 单 向 传输 速率 已 经 能 达到 2GB/s. PCI-E 接口 常见 于 对 数据 传输 要 求 很 
高 的 显卡 ， 而 对 于 机 械 硬 盘 来 说 ， 传 统 的 SATA 接口 已 经 能 满足 速度 需求 。 

固态 硬盘 相 比 于 机 械 人 硬盘 ， 有 着 更 高 的 传输 速率 。 目 前 消费 级 固态 硬盘 的 顺序 读 写 
速度 已 经 接近 SATA 3.0 接口 的 极限 ， 而 少量 企业 级 固态 硬盘 已 突破 这 一 极限 ， 因 此 采用 
了 传输 速率 更 高 的 PCI-E 接口 。 

5. 固态 硬盘 性 能 

对 于 固态 硬盘 来 说 , 影响 其 性 能 最 主要 的 部 件 有 两 个 : 首先 是 主 控 必 片 , 这 也 是 SSD 
产品 核心 的 部 分 。 第 二 是 用 于 数据 存储 的 闪存 芯片 ， 主 要 分 为 SLC、MLC 与 TLC 三 种 。 
另外 ， 固 态 硬盘 还 有 一 系列 常见 的 性 能 指标 ， 也 将 在 这 一 部 分 详细 介绍 。 

(1) 固态 硬盘 的 主 控 忆 片 

固态 硬盘 的 主 控 蕊 片 ， 承 担 了 平衡 各 个 蕊 片上 的 负载 、 数 据 中 转 ， 以 及 连接 内 存心 
片 与 外 部 接口 的 工作 。 不 同 的 主 控 忌 片 采 用 的 算法 差异 很 大 ， 对 闪存 芯片 的 读 写 控制 会 
有 很 大 不 同 , 会 直接 导致 性 能 上 差距 高 达 数 十 倍 。 主 控 忌 片 可 以 比 作 是 固态 硬盘 的 心脏 ， 
它 的 好 坏 直 接 影响 固态 硬盘 的 品质 。 

主 控 芯片 的 核心 部 件 是 闪存 转换 层 (flash translation layer，FTL)， 它 负责 维护 逻辑 
区 块 地 址 (logical block address, LBA) 与 物理 区 块 地 址 (physical block address, PBA) 
之 间 的 上 映射。 这 是 由 于 固态 硬盘 的 内 部 存储 机 制 较 为 复杂 ， 它 的 逻辑 地 址 与 物理 地 址 不 
能 直接 对 应 。 物理 上 ,闪存 蕊 片 的 存储 空间 分 为 页 面 和 块 ， 它 的 写 操作 是 以 页 面 为 单位 ， 
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而 探 除 操作 则 是 以 块 为 单位 ， 并 且 它 还 有 这 样 一 个 重要 特性 : 数据 写 入 之 前 一 定 要 先 擦 
除 ， 而 不 能 像 传统 硬盘 一 样 直接 覆盖 。 因 此 ， 在 闪存 芯片 上 删除 数据 ， 首 先 要 将 数据 所 
在 的 页 面 标记 为 无 效 ， 当 一 个 块 上 的 所 有 页 面 全 都 被 标记 为 无 效 时 ， 才 对 它 进行 擦 除 操 
作 ， 从 而 服务 于 新 的 写 入 操作 。 而 写 入 数据 时 ， 先 寻找 可 写 的 页 面 ， 如 果 没 有 , , 则 要 选 
取 一 些 含有 较 多 无 效 页 面 的 块 ， 读 出 块 上 的 有 效 页 面 ， 使 它们 变 成 空闲 块 ， 然 后 擦 除 并 
写 入 新 的 数据 。 正 是 由 于 这 个 原因 ， 数 据 的 物理 地 址 会 经 常 发 生 改 变 ， 因 此 需要 内 置 一 
个 办 存 转 换 层 来 维护 逻辑 区 块 地 址 到 物理 区 块 地 址 的 映射 。 

增加 FTL 也 使 固态 硬盘 的 对 外 接口 和 机 械 硬 盘 表 现 一 致 。 操 作 系统 只 需要 像 对 符 普 
通 人 硬盘 一 样 给 它 读 和 写 的 操作 ， 让 固态 硬盘 在 自己 内 部 进行 块 与 页 面 的 分 析 ， 并 转化 为 
读 取 、 擦 除 和 写 入 的 指令 。FLT 的 效率 决定 了 固态 硬盘 的 效率 ， 因 此 采用 高 效 算法 的 主 
控 蕊 片 能 提升 SSD 的 性 能 。 

主 控 忌 片 除 了 维护 地 址 映射 之 外 ， 通 常 还 具备 一 些 其 他 的 功能 ， 如 磨损 平衡 (wear 
leveling，WL)， 垃 圾 回收 (garbage collection, GC), WHEE (bad block management, 
BBM) 以 及 差错 检测 与 修正 (error checking and correcting, ECC) 等 。 

在 日 常 使 用 中 ， 数 据 的 访问 频率 通常 是 不 均衡 的 ， 某 些 数据 会 被 更 频繁 地 更 新 ， 而 
闪存 忆 片 有 探 写 次 数 限制 ， 因 此 会 使 存放 该 部 分 数据 的 闪存 先 被 消耗 完 ， 造 成 有 效 容量 
大 幅 减 少 。 磨 损 平 衡 技 术 可 以 克服 这 一 问题 ， 通 过 在 同一 数据 多 次 写 入 时 分 配 不 同 的 物 
理 地 址 ， 将 写 入 分 挫 在 不 同位 置 ， 从 而 使 内存 损耗 更 加 均衡 。 

垃圾 回收 是 提高 SSD 空间 利用 率 的 机 制 。 它 将 闪存 芯片 里 零散 的 有 效 页 面 集 中 起 
来 ， 复 制 到 空白 的 块 里 ， 再 将 这 些 数据 原来 所 在 的 块 擦 除 ， 使 其 成 为 可 写 入 的 空闲 块 ， 
由 此 增加 了 空闲 块 的 数量 。GC 通常 会 在 SSD 上 的 空闲 块 的 数量 告急 时 自动 执行 ， 但 它 
也 可 以 充分 利用 空闲 时 间 运 行 ， 从 而 保证 用 户 一 直 拥 有 良好 的 体验 。 

闪存 已 片上 存在 一 些 无 法 使 用 或 不 可 靠 的 块 ， 叫 作 坏 块 ， 它 们 有 的 是 出 厂 时 就 已 标记 
为 不 可 用 ,有 的 则 是 在 使 用 过 程 中 被 自然 损耗 。 坏 块 会 导致 内 存 无 法 准确 地 记录 数据 ， 如 果 
不 对 其 进行 检测 和 管理 ， 会 造成 用 户 数据 丢失 。 主 控 心 片 中 会 维护 一 张 坏 块 表 ， 当 发 现 系 
统 笑 试 访问 坏 块 时 ，FLT 会 重新 把 它 映射 到 好 的 块 地 址 上 。 坏 块 的 检测 则 依靠 ECC (一 种 
得 错 检测 和 修正 的 算法 )。 当 主 控 蔚 片 多 次 检验 到 一 个 块 出 现 错 误 时 ， 就 将 其 标记 为 坏 块 。 

(2) 固态 硬盘 的 存储 芯片 

目前 ,固态 硬盘 通常 用 闪存 作为 存储 必 片 。 闪 存 目前 主要 分 为 SLC(single-layer cell), 
MLC (multi-level cell) #1 TLC (triple-level cell) 3 种 类 型 。 

SLC 在 每 个 存储 单元 〈Cell) 中 存储 一 位 信息 。 每 个 存储 单元 能 存储 一 定数 量 的 电荷 ， 
从 而 使 其 具有 一 个 导 通 电压 值 。 在 SLC 中 ， 只 需 用 低 电 压 和 高 电压 记录 0、1 两 种 状态 。 在 
读 取 时 , 利用 位 于 数据 1 的 阀 值 电压 分 布 和 数据 0 的 阔 值 电压 分 布 之 间 的 参考 电压 , 可 以 确 
定 存储 单元 中 存储 的 数据 。 SLC 的 特点 有 , 读 写 速度 快 、 使 用 寿命 长 (有 10k 一 100k 次 P/E)， 
然而 其 成 本 较 高 ， 相 同 容量 下 要 比 MLC 贵 出 一 到 两 倍 ， 因 此 在 市 面 上 较为 稀少 。 

MLC 采用 双 层 设计 ， 即 每 个 存储 单元 能 同时 存储 2 位 数据 。 每 个 单元 有 4 种 存储 状 
态 ， 分 别 是 00、01、10、11， 因 此 需要 用 4 种 电压 值 来 表示 。 相 比 于 SLC，MLC 在 能 耗 
及 复杂 性 上 均 有 一 定 程度 的 增加 ， 写 入 的 速度 和 寿命 会 相对 降低 (P/E 为 3k 一 30k 次 )。 然 
而 MLC 技术 最 大 的 优势 就 是 提高 存储 密度 ， 即 同样 大 小 的 闪存 颗粒 能 存储 两 倍 的 数据 。 
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目前 市 面 上 主流 消费 级 固态 硬盘 采用 的 都 是 MLC 技术 。 尽 管 SLC 具有 更 长 的 使 用 
寿命 ， 但 是 普通 用 户 几 乎 不 可 能 用 到 它 的 极限 ， 而 MLC 在 寿命 上 已 经 完全 足够 常规 使 
用 , 并 且 成 本 更 低 , 单位 体积 的 容量 也 更 大 ， 从 而 成 为 更 加 理想 的 存储 介质 。 此外, MLC 
主 控 芯 片 技术 的 成 熟 也 使 得 数据 读 写 速度 非常 优异 ， 能 满足 大 部 分 用 户 的 需求 。 

TLC 采用 了 三 层 设 计 ， 即 每 个 存储 单元 能 存储 3 位 数据 ， 因 此 它 的 一 个 单元 需要 用 
8 种 存储 状态 来 表示 二 进 制 的 000 一 111。 它 的 特点 非常 明显 ， 存 储 密度 比 MLC 更 高 ， 
相同 容量 的 制造 成 本 更 低 ， 但 代价 是 更 低 的 写 入 速度 和 更 差 的 耐久 力 。TLC 芯片 的 P/E 
只 有 500~1 000 次 。 

(3) 固态 硬盘 的 性 能 指标 

固态 硬盘 最 常见 的 性 能 指标 有 : 连续 读 取 速 度 、 连 续 写 入 速度 、4K 随机 读 取 速度 、 
4K 随机 写 入 速度 等 。 这 些 指标 可 以 帮助 我 们 更 直观 地 了 解 固态 硬盘 的 好 坏 。 

O 连续 读 取 / 写 入 速度 。 这 两 个 指标 的 含义 是 ,在 固态 硬盘 上 读 写 连 续 存 放 的 数据 ， 
其 每 秒 的 传输 速率 是 多 少 。 这 两 个 指标 的 单位 通常 是 MB/s。 这 是 一 个 很 直观 的 性 能 指标 ， 
表示 在 最 理想 的 状态 下 ， 硬 盘 的 传输 速率 为 多 少 。 

D 4K 随机 读 取 / 写 入 速度 。 在 真实 的 使 用 环境 中 ， 读 写 小 文件 的 性 能 通常 是 日 常 应 用 
中 最 为 普遍 的 系统 瓶颈 , 因此 4K 随机 读 取 / 写 入 的 指标 更 能 反映 出 固态 硬盘 在 真实 环境 下 的 
使 用 性 能 。 连 续 读 写 速度 快 的 固态 硬盘 ， 未 必 4K 随机 读 写 速度 也 快 ， 原 因 可 能 在 于 主 控 芯 
片 、 算 法 、 缓 存 等 各 种 因素 。4K 随机 读 取 / 写 入 指标 的 单位 通常 为 IOPS (IO per second), 
表示 每 秒 完成 了 多 少 次 读 写 操作 。 通 常 ， 随 机 读 写 的 性 能 会 比 连续 读 写 的 性 能 有 所 下 降 。 

更 多 的 评测 指标 还 包含 512K 随机 读 取 / 写 入 速度 、 多 线程 下 的 读 取 / 写 入 速度 等 ， 它 
们 常见 于 一 些 磁盘 性 能 测试 软件 。 这 些 指标 都 是 固态 硬盘 在 不 同 场景 下 性 能 上 的 反映 ， 
具有 很 好 的 参考 价值 。 


2.3 主机 与 应 用 


主机 一 般 是 指 计算 机 完成 其 基本 功能 所 需要 的 最 主要 的 硬件 ， 通 常 包括 中 央 处 理 
器 、 内 存 、 电 源 、 主 板 、 硬 盘 、 风 扇 等 。 同 时 ， 主 机 为 了 实现 其 功能 ， 还 需要 一 些 必 不 
可 少 的 组 件 ， 诸 如 操作 系统 、 设 备 驱动 、 文 件 系 统 、 卷 管理 器 等 。 这 些 人 硬件 和 软件 的 集 
合 ， 共 同 构 成 了 一 个 最 简单 的 计算 机 主机) 系统 。 

本 节 着 重 介 绍 主机 中 与 VO 过 程 密切 相关 的 组 成 部 分 : 操作 系统 、 设 备 驱动 、 卷 管 
理 器 以 及 文件 系统 。 在 这 一 节 的 最 后 ， 还 会 简单 介绍 计算 机 集群 ， 它 通过 将 许多 台 主 机 
连接 起 来 形成 一 个 计算 机 网 络 ， 从 而 提供 更 强 的 运算 能 力 。 


2.3.1 操作 系统 


操作 系统 (operating system, OS) 是 一 种 用 于 管理 计算 机 硬件 与 软件 资源 的 程序 ， 
同时 也 是 计算 机 系统 的 内 核 与 基础 。 操 作 系统 负责 诸如 系统 资源 管理 、LIO 设备 控制 、 
文件 系统 管理 、 网 络 通信 等 基本 事务 ， 并 为 其 他 应 用 程序 提供 支持 ， 使 计算 机 系统 所 有 
资源 能 最 大 程度 被 利用 ， 为 用 户 提 供 方便 、 高 效 、 友 好 的 服务 界面 。 操 作 系 统 是 一 个 庞 
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大 的 管理 控制 程序 ， 主 要 包括 5 个 方面 的 管理 功能 ;进程 与 处 理 机 管理 、 作 业 管 理 、 存 
储 管 理 、 设 备 管理 、 文 件 管理 。 

目前 计算 机 系统 中 常见 的 操作 系统 包括 OS/2、UNIX、Linux、Windows、Mac OS, 
Netware 等 。 | 


2.3.2 ,设备 驱动 


设备 驱动 (device driver)， 是 一 种 可 以 使 操作 系统 和 设备 通信 的 特殊 程序 。 这 种 程 
序 创建 了 一 个 硬件 与 软件 沟通 的 接口 ， 使 得 与 硬件 设备 上 的 数据 交换 成 为 可 能 ， 而 操作 
系统 只 有 通过 这 个 接口 ， 才 能 控制 硬件 设备 的 工作 。 假 如 某 设备 的 驱动 程序 未 能 正确 安 
装 ， 设 备 便 不 能 正常 工作 。 正 因为 这 个 原因 ， 了 驱动 程序 在 系统 中 的 地 位 十 分 重要 ， 一 般 
当 操 作 系统 安装 完毕 后 ， 首 要 的 便 是 安装 硬件 设备 的 驱动 程序 。 

通常 来 说 ， 硬 件 的 生产 厂商 会 负责 维护 并 更 新 驱动 程序 。 好 的 驱动 程序 可 以 使 硬件 
稳定 流畅 地 工作 ， 并 充分 发 挥 硬件 的 性 能 ， 而 差 的 驱动 则 容易 发 生 错 误 ， 甚 至 使 硬件 发 
挥 不 出 应 有 的 性 能 。 


2.3.3 SER 


卷 管理 器 ， 又 称 逻 辑 卷 管理 器 (logical volume manager，LVM)， 它 是 计算 机 管理 物 
理 存 储 空间 的 重要 工具 ， 它 的 功能 是 对 连接 到 计算 机 上 的 存储 设备 进行 虚拟 化 。 具 体 地 说 ， 
卷 管理 器 将 计算 机 连接 的 所 有 物理 存储 设备 的 空间 统一 进行 管理 , 并 分 配 出 逻辑 卷 (计算 机 
所 看 到 的 一 些 相互 独立 的 存储 空间 )， 每 个 逻辑 卷 上 有 一 个 单独 的 文件 系统 。 而 操作 系统 无 
需 知道 每 个 卷 上 的 空间 是 来 自 于 底层 的 哪 块 磁盘 ,也 不 用 了 解 每 块 磁盘 的 物理 结构 和 分 区 
信息 ， 在 它 看 来 ， 所 有 逻辑 卷 上 的 空间 都 是 一 样 的 。 它 对 逻辑 卷 进行 的 读 写 操作 ， 最 终 都 
将 由 卷 管理 器 映射 到 真正 的 物理 磁盘 上 。 这 使 得 操作 系统 使 用 这 些 存储 空间 变 得 更 加 便捷 。 

简 而 言 之 ， 卷 管理 器 为 操作 系统 操作 磁盘 提供 了 一 层 抽象 。 它 不 仅 能 简化 操作 系统 
对 磁盘 的 操作 ， 还 可 以 更 好 地 管理 磁盘 空间 。 它 可 以 将 多 块 磁盘 合并 为 一 个 逻辑 卷 ， 也 
可 以 将 一 个 磁盘 分 割 成 多 个 逻辑 卷 ， 大 大 增加 了 分 配 空间 的 灵活 性 。 此 外 ， 卷 管理 器 使 
得 文件 系统 的 大 小 不 会 再 受 单 块 磁盘 大 小 的 限制 ， 也 避免 了 单 块 磁盘 空间 过 大 时 使 用 率 
很 低 的 问题 ， 因 此 它 也 提高 了 磁盘 空间 的 存储 效率 。 


2.3.4 ”文件 系统 


文件 系统 (file system) 是 操作 系统 的 一 个 子 系统 ， 其 实质 是 一 种 软件 组 件 ， 能 够 通 
过 对 一 个 或 者 多 个 物理 或 虚拟 磁盘 上 的 地 址 空间 的 结构 化 ， 使 应 用 程序 能 够 更 方便 地 处 
理 大 小 可 变 的 抽象 命名 的 数据 对 象 (文件 )。 文件 系统 不 仅 经 常 作为 操作 系统 组 件 提 供给 
用 户 ， 还 能 够 作为 独立 的 软件 组 件 来 实现 和 销售 。 

1. 文件 系统 的 组 成 

文件 系统 负责 维护 和 管理 文件 与 存储 介质 之 间 的 关系 。 文 件 系统 由 3 部 分 组 成 : 与 
文件 管理 有 关 的 软件 、 被 管理 的 文件 以 及 实施 文件 管理 所 需 的 数据 结构 。 文 件 是 一 种 抽 
象 数据 对 象 ， 该 数据 对 象 由 以 下 3 部 分 组 成 。 

(1) 存储 在 磁盘 或 者 磁带 上 的 有 序数 据 字 节 序 列 。 
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(2) 能 够 唯一 标识 该 数据 对 象 的 符号 名 称 〈 文 件 名 )。 

(3) 一 系列 属性 集合 ， 包 括 所 有 者 、 访 问 权 限 〈 人 允许 文件 系统 或 者 备份 管理 器 来 管 
理 该 数据 对 象 ) 等 。 

与 存储 介质 的 固定 编 址 空间 不 同 的 是 ， 文 件 可 以 被 创建 或 者 删除 ， 并 且 在 大 多 数 的 
文件 系统 中 ， 文 件 的 大 小 在 其 生命 周期 内 可 以 增加 或 者 减 小 。 从 系统 角度 而 言 ， 文 件 系 
统 是 对 文件 存储 器 空间 进行 组 织 和 分 配 ， 负 责 文 件 的 存储 并 对 存 入 的 文件 进行 保护 和 检 
索 的 系统 。 具 体 而 言 ， 它 负责 为 用 户 建立 文件 ， 存 入 、 读 出 、 修 改 、 转 储 文件 ， 控 制 文 
件 的 存 取 ， 以 及 文件 的 撤销 等 。 

2 文件 系统 的 功能 

文件 系统 的 功能 可 以 分 为 3 个 方面 : 分 配 (allocation)、 管 理 (management) 和 操 
作 (operation)。 

(1) 分 配 。 文 件 系统 具有 将 VO 设备 组 织 成 为 功能 性 存储 单元 的 能 力 。 文 件 系统 负 
责 对 存储 介质 中 的 卷 和 文件 这 两 个 最 重要 的 元 素 进行 分 配 。“ 卷 ?表示 卷 管理 器 控制 软件 
所 创建 的 虚拟 磁盘 〈 虚 拟 磁 盘 被 定义 为 一 个 逻辑 实体 ， 有 一 个 或 多 个 提供 实际 存储 容量 
的 物理 磁盘 组 ); 而 “文件 ”代表 的 是 一 组 数据 的 集合 ， 操 作 系 统 或 者 应 用 程序 可 以 通过 
某 种 类 型 的 命名 方式 对 文件 进行 访问 。 

(2) 管理 。 文 件 系统 能 够 对 保存 在 IO 设备 上 的 数据 进行 跟踪 、 保 护 和 控制 。 

(3) 操作 。 文 件 系统 可 以 对 逻辑 数据 序列 进行 查找 定位 ， 其 所 使 用 的 查找 手段 取决 
于 数据 的 可 还 原 性 以 及 系统 的 严密 性 。 

3. 常见 的 文件 系统 

常见 文件 系统 根据 操作 系统 的 区 别 而 不 同 ， 通 常 包括 在 Linux 环境 下 使 用 的 Ext2、 
Ext3、Ext4、JFS， 以 及 在 Windows 下 使 用 的 Fat16、Fat32、exFat 和 NTFS 等 。 


2.3.5 ”集群 


集群 将 许多 计算 设备 通过 软件 或 硬件 连接 起 来 ， 组 成 一 个 大 型 计算 网 络 ， 并 使 这 些 
计算 设备 高 度 紧 密 地 协作 完成 计算 任务 。 集 群 使 得 一 些 单 台 主 机 无 法 胜任 的 大 规模 运算 
任务 的 执行 成 为 可 能 ， 如 大 数据 的 处 理 、 大 规模 机 器 学 习 等 。 相 比 于 使 用 性 能 更 高 的 超 
级 计算 机 来 完成 这 些 任务 ， 采 用 集群 的 成 本 更 低 、 可 扩展 性 更 高 ， 并 且 可 以 充分 利用 朵 
置 的 计算 设备 来 提高 集群 性 能 ， 因 此 这 项 技术 更 加 受到 人 们 的 青睐 。 

但 集群 也 带 来 了 一 些 新 的 问题 ， 如 如 何 容忍 集群 中 少量 计算 设备 出 现 的 错误 、 如 何 
将 一 个 任务 分 解 成 大 家 可 以 协同 完成 的 子 任 务 、 如 何 分 配 集群 资源 ， 等 等 。 现 在 ， 这 一 
领域 已 经 有 很 多 成 熟 的 技术 来 解决 这 些 问 题 ， 使 得 集群 的 应 用 更 加 广泛 。 


2.4 大 数据 应 用 的 挑战 


2.4.1 大 数据 的 概念 
大 数据 (big data) 是 一 个 宽泛 的 概念 ， 任 何 传统 数据 处 理应 用 无 法 在 指定 时 间 内 完 
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成 指定 任务 的 庞大 的 ， 或 复杂 的 数据 集 ， 都 可 以 称 为 大 数据 。 大 数据 的 4V 特点 总 结 如 下 。 

l. volume: 数据 量 大 

通过 各 种 设备 每 天 都 产生 海量 数据 。 传统 的 数据 处 理 技 术 能 处 理 GB 到 TB 的 数据 ， 
而 大 数据 技术 处 理 的 数据 量 往往 超过 PB 级 别 。 

2. velocity: 数据 处 理 速度 快 

对 数据 实时 处 理 有 者 极 高 的 要 求 ， 通 过 传统 数据 库 碍 询 方式 得 到 的 “当前 结果 ”很 
可 能 已 经 没有 价值 。 

3. variety: 数据 类 型 多 样 

传统 的 数据 通常 可 以 组 织 成 表格 形式 ， 从 而 用 关系 数据 库 来 存储 与 管理 ， 这 是 典型 
的 结构 化 数据 。 而 大 数据 还 包含 了 图 片 、 视 频 、 音 频 等 非 结 构 化 或 半 结 构 化 的 数据 。 

4. value: 价值 密度 低 

大 数据 的 价值 体现 在 其 样本 丰富 性 ， 从 而 使 挖掘 出 的 信息 更 加 精准 ， 涵 盖 面 更 广 ， 
拥有 更 大 人 价值。 相反， 在 数据 量 不 够 时 ， 数 据 可 能 无 法 体现 出 价值 。 

第 13 章 ， 将 对 大 数据 进行 详细 介绍 。 


2.4.2 ”大 数据 应 用 对 存储 的 挑战 


大 数据 的 核心 是 提升 大 量 数 据 的 分 析 能 力 。 但 是 ， 大 数据 分 析 能 力 不 仅 在 于 数据 管 
理 策略 、 数 据 可 视 化 分 析 能 力 等 方面 ， 从 根本 上 也 对 数据 中 心 T 基础 设施 架构 等 提出 了 
更 高 要 求 。 为 了 具备 迅速 、 高 效 处 理 大 数据 的 能 力 ， 整 个 IT 基础 设施 需要 进行 整体 优化 
设计 ， 充 分 考虑 后 台数 据 中 心 的 高 效 性 、 可 靠 性 、 业 务 连 续 性 等 。 这 些 都 是 大 数据 应 用 
给 存储 带 来 的 挑战 。 

数据 中 心 的 高 效 性 体现 在 访问 数据 的 响应 时 间 上 。 当 处 理 巨 量 的 数据 时 ， 除 开 计 算 
所 花费 的 时 间 外 ， 在 整个 存储 系统 (通常 是 分 布 式 系 统 ) 中 数据 的 访问 非常 频繁 。 同 时 ， 
大 量 数据 与 中 间 结 果 在 网 络 中 传输 ， 给 整个 系统 带 来 了 巨大 的 压力 。 数 据 中 心 需要 有 更 
快 的 硬件 、 更 大 的 带宽 ， 以 及 更 高 效 的 存储 算法 ， 以 满足 大 数据 应 用 的 需求 。 

可 靠 性 也 是 大 数据 应 用 中 不 容 忽视 的 问题 。 随 着 大 数据 时 代 的 来 临 ， 数 据 应 用 产生 
庞大 的 数据 碎片 , 数据 计量 单位 由 原本 的 Byte. KB. MB. GB(GigaByte, 1GB=1 024MB), 
到 现在 普遍 达到 了 TB (TeraByte, 1TB=1 024GB), PB (Peta Byte, 1PB=1024TB) 级 
别 。 这 样 的 数据 规模 已 经 无 法 通过 传统 的 系统 在 合理 的 时 间 内 完成 指定 的 工作 。 因 此 ， 
需要 用 到 大 量 的 硬盘 进行 存储 ， 而 硬盘 数量 的 增加 意味 着 出 现 故障 的 几率 也 将 增加 。 为 
了 避免 数据 丢失 ， 数 据 中 心 需 要 有 更 强 的 容错 能 力 ， 能 在 多 块 便 盘 失效 的 情况 下 恢复 出 
数据 ， 并 且 要 有 更 快 的 数据 恢复 能 力 ， 将 硬盘 故障 带 来 的 影响 降 至 最 低 。 

对 于 一 些 具 有 实时 性 的 大 数据 应 用 来 说 ， 保 证 其 功能 在 发 生 任 何 大 型 灾难 下 都 能 保 
持 百 分 之 百 可 用 ， 即 保证 业务 的 连续 性 ， 具 有 非常 高 的 价值 。 业 务 连 续 性 是 计算 机 容 灾 
技术 的 升华 概念 ， 是 一 种 由 计划 和 执行 过 程 组 成 的 策略 。 可 以 这 样 说 ， 业 务 连续 性 是 履 
盖 整 个 企业 的 技术 以 及 操作 方式 的 集合 ， 其 目的 是 保证 企业 信息 流 在 任何 时 候 以 及 任何 
需要 的 状况 下 ， 都 能 保持 业务 连续 运行 。 

在 存储 系统 的 层面 上 ， 要 保证 业务 连续 性 ， 即 要 做 应 用 级 的 容 灾 备份 ， 保 证 当 人 为 
或 自然 灾难 发 生 时 ， 主 要 业务 能 最 快 时 间 转 移 至 备份 系统 上 ， 从 而 实现 业务 连续 性 。 
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25 本章 总 结 


完成 本 章 学 习 ， 将 能 够 : 
。 了 解 存 储 的 应 用 环境 。 
oo 了 解 机 械 硬盘 及 固态 硬盘 的 结构 和 实现 原理 。 
。 了 解 主机 应 用 环境 。 
。 了 解 大 数据 应 用 对 存储 的 挑 成 。 


2.6 ”练习 题 


一 、 选 择 题 
1. 网 络 存储 结构 大 致 分 为 《 ) 3 类 。 

A. DAS B. SAN C. DNA D. NAS 
答案 (ABD) 
2. SATA 3.0 接口 的 理论 传输 速率 能 达到 C 

A. 150MB/s B. 300MB/s C. 600MB/s D. 1GB/s 
EFR (C) 
3. 固态 硬盘 相 比 于 机 械 硬盘 所 具有 的 优点 ， 不 包 插 ( Jo 

A. 抗震 性 好 B. 无 噪音 C. 成 本 低 D. 速度 快 
ÆR (C) 
4. 固态 硬盘 的 主 控 芯 片 中 ，( ) 功能 可 以 延长 使 用 寿命 。 

A. ECC B. WL Cc. GC D. BBM 
答案 (B) 
5. 文件 系统 的 功能 可 分 为 ) 3 方面 。 

A. 4y ic B. 维护 C. 管理 D. 操作 
答案 (ACD) 
6. 大 数据 的 特点 包括 ( ye 

A. 数据 量 大 B. 数据 增长 速度 快 

C. 数据 类 型 多 样 D. 数据 价值 密度 高 ， 
答案 (ABC) 
二 、 简 答题 


1. ,存储 的 IO 流程 需要 经 过 哪些 步骤 ? 为 何 要 采取 这 样 的 设计 ? 
2. 机 械 硬盘 与 固态 硬盘 各 自 有 哪些 特点 ?分 别 列 出 3 个 适合 于 机 械 人 硬盘 和 固态 便 
盘 的 应 用 场景 。 
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3.6 
3.7 
3.8 
3.9 
3.10 
3.11 
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3.13 








服务 器 概述 
服务 器 的 分 类 

处 理 器 的 发 展 与 技术 
内 存 的 发 展 与 技术 
服务 器 MO 总 线 
服务 器 RAID 技 术 

服务 器 高 级 技术 与 发 展 
服务 器 操作 系统 
服务 器 文件 系统 

服务 器 高 可 用 集群 技术 与 应 用 
华为 服务 器 产品 介绍 
本 章 总 结 

练习 题 





关于 本 章 


服务 器 是 整个 IT 系统 的 重要 组 成 部 分 之 一 ， 随 着 技术 的 发 展 ， 服 务 顺 的 相关 技术 也 发 生 
了 巨大 的 变化 。 本 章 从 服务 器 的 发 展 历史 、 功 能 与 作用 等 方面 人 手 ， 对 服务 髓 进行 全 面 介 
绍 ， 包 括 服 务 器 高 级 应 用 技术 ， 如 双 机 热 备 、 集 群 等 功能 。 
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3.1 服务 器 概述 


3.1.1 服务 器 简介 


服务 器 (server) 是 在 网 络 上 提供 各 种 服务 的 高 性 能 计算 机 。 服 务 器 是 20 世纪 90 
年 代 迅 速 发 展 的 主流 计算 机 产品 ， 能 为 网 络 用 户 提 供 集中 计算 、 信 息 发 布 及 数据 管理 等 
服务 ， 也 可 以 将 与 其 相连 的 硬盘 、 磁 带 机 、 打 印 机 、Modem 及 各 种 专用 通信 设备 共享 给 
网 络 上 的 用 户 。 

服务 器 的 结构 与 普通 桌面 PC 相似 ， 由 主板 、 处 理 器 、 硬 盘 、 内 存 等 组 成 ， 不 过 它 
们 上 层 系统 软件 是 针对 具体 的 应 用 特别 定制 的 。 随 着 信息 技术 的 进步 ， 网 络 的 作用 越 来 
越 明 显 ， 对 信息 系统 数据 的 处 理 能 力 、 安 全 性 等 方面 的 要 求 也 越 来 越 高 ， 因 而 服务 器 与 
普通 桌面 PC 在 处 理 能 力 、 稳 定性 、 可 靠 性 、 安 全 性 、 可 扩展 性 、 可 管理 性 等 方面 存在 
很 大 差异 。 

服务 器 作为 网 络 的 重要 节点 ， 处 理 网 络 上 80% 的 数据 和 信息 ， 因 此 也 被 称 为 网 络 的 
RB 


3.1.2 ”服务 器 的 主要 特点 


服务 器 是 计算 机 网 络 中 技术 较为 复杂 的 IT 产品， 下 面 将 对 服务 器 的 特点 进行 介绍 。 

1. 处 理 能 力 强 

通常 ， 服 务 器 在 运行 过 程 中 需要 接受 大 量 来 自 外 部 的 请 求 ， 并 对 请 求 进行 处 理 ， 如 
数据 的 存储 与 读 取 、 数 据 的 计算 等 ， 再 将 请 求 处 理 的 结果 反馈 给 请 求 的 发 起 方 。 因 此 ， 
服务 器 需要 强大 的 处 理 能 力 ， 以 保证 上 述 工作 能 够 正确 、 高 效 地 进行 。 

服务 器 具有 强大 的 CPU, 通常 采用 多 核 ， 以 保证 服务 器 对 多 线程 任务 以 及 强大 并 行 
处 理 能 力 的 支持 。 目 前 ， 大 部 分 服务 器 甚至 具有 多 处 理 器 架构 ， 从 而 进一步 提升 了 服务 
器 的 并 行 处 理 能 力 。 

回 量 处 理 器 ， 又 称 数组 处 理 器 ， 是 一 种 实现 了 直接 操作 一 维 数组 〈 回 量 ) 指令 集 的 
中 央 处 理 器 (CPU )。 这 与 一 次 只 能 处 理 一 个 数据 的 标量 处 理 器 正好 相反 。 回 量 处 理 器 可 
以 在 特定 工作 环境 中 极 大 地 提升 性 能 ， 尤 其 是 在 数值 模拟 或 者 相似 领域 。 

GPU (graphic processing unit) 的 中 文 意思 为 “图 形 处 理 器 ”。GPU 是 相对 于 CPU 
的 一 个 概念 。 在 浮 点 运算 、 并 行 计算 等 部 分 计算 方面 ，GPU 可 以 提供 数 十 倍 乃 至 于 上 百 
倍 于 CPU 的 性 能 。 在 异 构 协 同 处 理 计算 模型 中 将 CPU 与 GPU 结合 起 来 加 以 利用 。 应 用 
程序 的 串 行 部 分 在 CPU 上 运行 ， 而 计算 任务 繁重 的 部 分 则 由 GPU 来 加 速 。 将 CPU 5 
GPU 整合 或 者 融合 在 一 起 更 有 利于 二 者 之 间 协 同 发 挥 作 用 。 

问 量 处 理 器 以 及 GPU 的 相关 技术 也 用 于 服务 器 ， 以 并 行 执行 大 量 的 简单 运算 ， 从 
而 提高 处 理 效率 并 减轻 CPU 的 负担 。 

2， 主 板 复杂 且 功 能 强大 

一 般 而 言 ， 服 务 器 主板 要 比 PC 主板 大 ， 这 主要 是 因为 在 主板 上 要 安装 的 组 件 比 普 
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通 PC Z, W PCI (5 UE) PCI-X, AFIRE (4 条 以 上 )， 还 可 能 有 多 个 CPU 插座 。 
有 的 为 了 节省 主板 的 空间 , 把 部 分 比较 集中 的 功能 件 用 另外 一 块 单独 的 板 卡 提供 。 例 如 ， 
有 的 服务 器 会 在 一 块 板 卡 上 集成 所 有 的 PCI BK PCI-X H. 

3. 硬盘 、 内 存 容量 大 、 速 度 快 且 可 靠 性 高 

一 般 而 言 ， 服 务 器 需要 安装 一 定 的 系统 、 应 用 软件 ， 如 操作 系统 、 数 据 库 管 理 系统 
等 ， 这 些 都 需要 大 量 的 存储 空间 ， 另 外 ， 服 务 器 在 处 理 大 量 的 访问 和 数据 时 ， 也 会 产生 
大 量 需 要 保存 的 数据 ， 再 次 ， 大 型 服务 器 还 需要 较 大 的 VO 带宽 以 满足 应 用 对 读 写 速度 
的 要 求 ， 以 及 一 定 的 机 制 确保 数据 可 靠 性 。 因 此 ， 早 期 服务 器 通常 采取 磁盘 阵列 的 方式 
组 织 磁盘 ， 以 解决 早期 磁盘 容量 过 小 而 带 来 的 存储 空间 不 足 的 问题 ， 从 而 提高 服务 器 磁 
盘 容 量 。 随 着 技术 的 进步 ， 目 前 的 硬盘 容量 已 经 有 了 非常 大 的 提高 ， 最 高 已 达到 4TB。 
因此 ， 目 前 一 般 的 中 小 型 网 络 服务 器 由 于 对 IO 带宽 的 要 求 并 不 太 高 ， 而 在 容量 上 只 需 
一 块 便 盘 就 足够 了 ， 因 此 采用 磁盘 阵列 的 主要 目的 是 利用 磁盘 阵列 的 数据 元 余 性 提高 数 
据 的 安全 性 与 可 靠 性 ， 此 外 磁盘 阵列 还 可 以 提供 并 行 读 写 能 力 ， 提 升 数 据 访问 效率 。 当 
然 ， 对 于 业务 量 巨大 的 大 型 服务 器 ， 如 一 些 邮 件 服务 器 、 数 据 库 服务 器 、 电 子 商 务 网 站 
的 服务 器 ， 其 所 需 的 存储 空间 在 目前 来 说 仍 不 可 能 由 一 块 磁盘 来 满足 ， 因 为 这 种 服务 器 
通 弟 所 需 的 磁盘 容量 都 是 PB 级 的 ， 这 时 仍 需 要 使 用 磁盘 阵列 ， 以 提供 足够 的 存储 空间 。 

在 计算 机 运行 过 程 中 ， 系 统 程序 与 应 用 程序 的 数据 大 多 存放 在 内 存 中 。 在 操作 系统 
的 地 址 映射 过 程 中 ， 帮 发 现 所 要 访问 的 页 面 不 在 内 存 中 ， 则 产生 缺 页 中 断 。 当 发 生 缺 页 
中 断 时 ， 操 作 系统 必须 在 内 存 选 择 一 个 页 面 将 其 移出 内 存 ， 以 便 为 即将 调 入 的 页 面 让 出 
空间 。 此 时 会 发 生 访问 外 存 的 操作 。 然 而 内 存 和 外 存 之 闻 的 存 取 速 度 差 异 巨大 ， 访 问 外 
存 与 访问 内 存 相 比 会 带 来 巨大 的 响应 延迟 。 内 存 越 大 ， 能 够 存储 的 页 面 越 多 ， 产 生 的 缺 
页 中 断 越 少 。 因 此 ， 对 于 有 着 大 量 访问 和 计算 请 求 需 要 处 理 的 服务 器 而 言 ， 内 存 大 小 直 
接 影响 系统 的 运行 速度 。 一 般 而 言 ， 服 务 器 所 处 网 络 越 大 、 越 复杂 、 数 据 流量 越 高 ， 对 
内 存 的 需求 也 就 越 高 。 现 在 ， 一 般 的 中 小 型 服务 器 都 在 几 十 GB 以 上 ， 而 一 些 大 型 的 服 
务 器 可 以 文 持 容量 高 达 数 TB 的 内 存 。 此 外 ， 有 些 服务 器 内 存 采 用 了 一 定 的 容错 与 恢复 
机 制 , 如 ECC 技术 等 , 确保 了 内 存 数据 的 可 靠 性 , 从 而 提升 了 服务 器 的 稳定 性 与 可 靠 性 。 

4. 支持 热 插 拔 

服务 器 上 承载 的 大 部 分 业务 是 不 允许 中 断 的 ， 所 以 “ 热 插 拔 ” 显 得 尤为 重要 。“ 热 插 
拔 ” 是 一 项 便于 服务 器 部 件 蔡 换 的 技术 , 它 支 持 在 服务 器 运行 的 过 程 中 , 增添 或 者 移 除 服 
务 器 的 一 个 或 多 个 部 件 ， 而 不 需要 服务 器 重新 启动 。 热 插 拔 技术 的 出 现 ， 极 大 地 降低 了 
服务 器 维护 的 难度 与 成 本 ， 保 证 了 服务 器 的 不 间断 运行 。 

目前 大 部 分 的 服务 器 中 文 持 热 择 拔 技术 的 部 件 有 硬盘 、 电 源 、 风 扇 、PCI 适 配 卡 等 。 
此 外 ， 在 一 些 高 端 服务 器 (如 HP 9000 系列 ) 中 ， 内 存 与 CPU 也 是 支持 热 揪 拔 的 ， 所 有 
支持 热 插 拔 技术 的 部 件 均 可 在 线 直接 安装 或 者 从 服务 器 上 拆卸 ， 这 样 极 大 地 方便 了 服务 
器 的 维护 ， 确 保 服务 器 持久 地 运行 。 

5. TREE 

服务 器 部 件 长 时 间 运 行 会 发 生 故 障 并 导致 服务 器 无 法 正常 运行 。 目 前 大 多 数 服务 器 
都 对 这 些 部 件 进 行 元 余 配 置 ， 以 保证 服务 器 的 持续 运行 。 各 类 元 余 的 部 件 之 间 互 为 备份 ， 
当 某 一 个 部 件 故 障 时 ， 剩 余部 件 能 继续 工作 ， 从 而 保证 服务 器 的 持续 运行 。 
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3.2 ”服务 器 的 分 类 


服务 器 发 展 到 今天 其 种 类 繁多 ， 拥 有 各 种 功能 、 不 同 应 用 环境 下 的 特定 服务 器 不 断 
涌现 。 现 阶段 服务 器 分 类 汇总 如 表 3-1 所 示 。 


表 3-1 服务 器 的 分 类 





非 x86 服务 器 
x86 服务 器 
入 门 级 服务 器 
工作 组 服务 器 
按 应 用 层次 划分 部 门 级 服务 器 
企业 级 服务 器 
CISC 架构 服务 器 
按 服务 器 的 处 理 器 架构 划分 RISC 架构 服务 器 
VLIW 架构 服务 器 
通用 型 服务 器 
按 服务 器 用 途 划 分 专用 型 服务 器 
塔 式 服务 器 
机 架 式 服务 器 
按 服务 器 的 机 箱 结构 划分 机 柜 式 服务 器 
刀片 式 服务 器 
模块 化 服务 器 


按照 体系 架构 来 划分 





3.2.1 ”按照 体系 架构 来 划分 


目前 ， 按 照 体 系 架构 来 划分 ， 服 务 器 主要 分 为 以 下 两 类 。 

1. x86 服务 器 

x86 服务 器 又 称 复杂 指令 集 (complex instruction set computer，CISC) 架构 服务 器 ， 
即 通常 所 讲 的 PC 服务 器 ， 它 是 基于 PC 体系 结构 ， 使 用 Intel 或 其 他 兼容 x86 指令 集 的 
处 理 器 芯片 的 服务 器 。 这 一 类 服务 器 的 价格 便宜 、 兼 容 性 好 、 稳 定性 和 安全 性 相对 较 低 ， 
主要 用 在 中 小 企业 和 非 关 键 业 务 中 。 

2. AE x86 服务 器 

JE x86 服务 器 包括 大 型 机 、 小 型 机 和 UNIX 服务 器 , 它们 是 使 用 精简 指令 集 (reduced 
instruction set computer, RISC) 处 理 器 ， 并 且 主 要 采用 UNIX 和 其 他 专用 操作 系统 的 服 
务 器 。 这 一 类 服务 器 的 价格 昂贵 、 体 系 封闭 , 但 是 稳定 性 好 ， 性 能 强大 ， 主 要 用 在 金融 、 
电信 等 大 型 企业 的 核心 系统 或 大 中 型 企业 的 关键 业务 中 。 


3.2.2 ” 按 应 用 层次 划分 
按 应 用 层次 对 服务 器 进行 划分 是 较为 普遍 的 一 种 方式 ， 它 主要 根据 服务 器 在 网 络 中 
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应 用 的 层次 来 划分 。 按 这 种 划分 方法 ， 服 务 器 通常 可 被 分 为 ， 入 门 级 服务 器 、 工 作 组 级 
服务 器 、 部 门 级 服务 器 和 企业 级 服务 器 。 

1. 入 门 级 服务 器 

入 门 级 服务 器 设计 简单 ， 功 能 有 限 ， 是 服务 器 中 最 为 基础 和 低 端 的 一 类 。 较 多 入 门 
级 服务 器 在 价格 、 配 置 方面 甚至 与 个 人 电脑 相差 无 几 。 

入 门 级 服务 器 通常 只 具备 以 下 几 方 面 的 特性 。 

(1) 部 分 硬件 具备 元 余 性 ， 如 硬盘 、 电 源 、 风 扇 等 。 

(2) 部 分 硬件 支持 热 插 拔 。 

(3) CPU 数量 较 少 ， 通 常 只 有 一 个 。 

(4) 内 存 容量 通常 较 小 ， 一 般 在 10GB 以 内 ， 但 通常 会 采用 带 ECC 纠 错 技术 的 服务 
器 专用 内 存 。 

2. 工作 组 服务 器 

工作 组 服务 器 是 一 个 比 入 门 级 高 一 个 层次 的 服务 器 ， 但 仍 属 于 低档 服务 器 的 范围 。 
它 能 连接 的 用 户 数 限制 在 一 个 工作 组 (50 台 左 右 )， 它 的 特点 是 网 络 规模 较 小 ， 对 服务 
器 的 性 能 要 求 不 是 很 高 。 工 作 组 服务 器 主要 具有 以 下 几 方 面 的 特点 。 

(1) 通常 仅 支持 单 或 双 CPU 结构 的 应 用 服务 器 。 

(2) 可 支持 大 容量 的 ECC 内 存 和 增强 服务 器 管理 功能 的 SM 总 线 。 

(3) 采用 Intel 服务 器 CPU 和 Windows / NetWare 网 络 操作 系统 ， 但 也 有 一 部 分 采 
用 UNIX 系列 操作 系统 。 

(4) 功能 较 全 面 ， 可 管理 性 强 ， 且 易于 维护 。 

(5) 可 以 满足 中 小 型 网 络 用 户 的 数据 处 理 、 文 件 共享 、Internet 接 入 及 简单 数据 库 应 
用 的 需求 。 

(6) 工作 组 服务 器 较 入 门 级 服务 器 来 说 性 能 有 所 提高 ， 功 能 有 所 增强 ， 有 一 定 的 可 
扩展 性 ， 但 容错 和 元 余 性 能 仍 不 完善 ， 也 不 能 满足 大 型 数据 库 系 统 的 应 用 。 

3. 部门 级 服务 器 

部 门 级 服务 器 属于 中 档 服务 器 。 通 常 ， 部 门 级 服务 器 采用 了 双 CPU 以 及 双 CPU 以 
上 的 对 称 处 理 器 架构 ， 具 有 较为 完备 的 硬件 配置 ， 如 磁盘 阵列 、 存 储 托 架 等 。 因 此 ， 部 
门 级 服务 器 具有 较 强 的 处 理 与 计算 能 力 。 

部 门 级 服务 器 在 继承 工作 组 服务 器 全 部 特性 的 基础 上 ， 集 成 了 大 量 的 监测 与 管理 电 
路 ， 拥 有 较为 全 面 的 服务 器 管理 能 力 。 部 门 级 服务 器 可 以 对 温度 、 电 压 、 风 扇 、 机 箱 等 
状态 参数 进行 检测 ， 以 使 系统 了 解 服务 器 当前 的 运行 状态 。 

目前 ， 部 门 级 服务 器 通常 采用 RISC 架构 的 处 理 器 。 在 过 去 ， 所 用 的 操作 系统 通常 
是 UNIX 操作 系统 。 不 过 ， 随 着 Linux 内 核 技术 的 发 展 与 成 熟 ， 目 前 Linux 操作 系统 也 
在 部 门 级 服务 器 中 得 到 了 较为 广泛 的 应 用 。 

部 门 级 服务 器 适用 于 对 处 理 速度 和 系统 可 靠 性 要 求 较 高 的 中 小 型 企业 网 络 ， 其 硬件 
配置 相对 较 高 ， 而 且 可 靠 性 也 比 工作 组 级 服务 器 高 。 

4， 企 业 级 服务 器 

企业 级 服务 器 属于 高 档 服 务 器 。 企 业 级 服务 器 采用 了 4 CPU 以 及 4 CPU 以 上 的 对 称 
处 理 器 架构 。 通 常 ， 企 业 级 服务 器 具有 独立 的 双 PCI 通道 以 及 内 存 扩展 板 的 设计 ， 具 有 
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较 高 的 内 存 带宽 、 热 插 拔 电源 以 及 大 容量 的 热 插 拔 硬盘 、 较 强 的 数据 处 理 能 力 与 群集 性 
能 等 特点 。 企 业 级 服务 器 机 箱 体 积 较 大 ， 通 常 为 机 柜 式 机 箱 ， 有 的 企业 级 服务 器 甚至 像 
大 型 机 一 样 ， 由 多 个 机 柜 组 成 。 

企业 级 服务 器 具有 部 门 级 服务 器 的 全 部 特点 ， 并 且 还 具备 较 高 的 容错 能 力 、 较 高 的 
扩展 性 能 、 故 障 预 警 功 能 以 及 在 线 诊 断 能 力 ， 此 外 其 RAM、PCI、CPU 等 部 件 具 有 热 插 
拔 能 力 。 企 业 级 服务 器 适用 于 需要 处 理 大 量 数 据 、 较 高 的 处 理 速度 以 及 对 可 靠 性 要 求 较 
高 的 应 用 环境 ， 如 金融 、 证 券 、 交 通 、 邮 电 、 通 信和 或 大 型 企业 。 


3.2.3 ” 按 服 务 器 的 处 理 器 架构 划分 


根据 服务 器 采用 的 处 理 器 架构 ,可 分 为 CISC 架构 服务 器 、RISC 架构 服务 器 和 VLIW 
架构 服务 器 3 种 。 

1. CISC 架构 服务 器 

CISC 的 全 称 为 “Complex Instruction Set Computer”， 即 “复杂 指令 集 计 算 机 ”。 
目前 ， 较 多 的 处 理 器 (CPU) 厂商 在 研发 CISC 处 理 器 ， 如 Intel 与 AMD. 在 CISC 
处 理 器 中 , 每 条 指令 都 十 分 复杂 , 在 指令 的 执行 过 程 中 需要 耗费 较 多 的 时 间 进 行 指 令 
的 译 码 操作 。 此 外 ， 一 条 指令 可 能 对 应 了 较 多 的 操作 ， 因 此 ， 指 令 的 执行 需要 耗费 较 
多 的 时 间 ， 执 行 效率 较 低 。 但 是 ， 顺 序 执行 的 优点 在 于 易于 设计 、 控 制 简 单 。CISC 
架构 的 服务 器 主要 以 IA-32 架构 (Intel architecture， 英 特 尔 架构 ) 为 主 ， 多 为 中 低档 
服务 器 。 

每 种 操作 系统 都 有 其 特定 的 硬件 平台 支持 列表 ， 通 常 基于 Windows NT 的 应 用 基本 
上 都 定位 于 IA 架构 (CISC 架构 ) 的 服务 器 。 如 果 服 务 器 应 用 必须 基于 Solaris， 那 么 服 
务 器 只 能 选择 SUN 服务 器 。 如 果 应 用 是 基于 AIX OBM 的 UNIX 操作 系统 ) 的 ， 那 么 
只 能 选择 IBM UNIX 服务 器 (RISC 架构 服务 器 )。 

2. RISC 架构 服务 器 

RISC 的 全 称 为 “reduced instruction set computing”， 即 “精简 指令 集 计 算 机 ” FALL 
于 上 面 提 到 的 CISC， 它 的 指令 集 较为 简单 ， 因 为 它 只 要 求 处 理 器 执行 简单 的 指令 ， 其 余 
的 复杂 操作 则 使 用 成 熟 的 编译 技术 ， 由 简单 指令 合成 。 目 前 ， 较 多 的 中 高 档 服务 器 采用 
RISC 处 理 器 ， 特 别 是 高 档 服务 器 ， 几 乎 全 都 采用 了 RISC 处 理 器 。 在 中 高 档 服务 器 中 采 
用 RISC 指令 的 CPU 主要 有 Compaq( 康 柏 , 即 新 惠普 ) 公 司 的 Alpha. HP 公司 的 PA-RISC、 
IBM 公司 的 Power PC. MIPS 公司 的 MIPS 和 SUN 公司 的 Spare. 

3. VLIW 架构 服务 器 

VLIW 的 全 称 为 “very long instruction word”, 即 “ 超 长 指令 字 ” VLIW 架构 采用 了 
先进 的 设计 ， 我 们 也 把 这 种 架构 叫 作 “IA-64 架构 ” 在 每 个 时 钟 周期 中 ， 相 比 于 CISC 
通常 只 能 运行 1~3 条 指令 ，RISC 能 运行 4 条 指令 ,而 IA-64 却 能 够 运行 20 条 指令 ， 可 
见 VLIW 拥有 比 CISC H RISC 更 为 强大 的 处 理 能 力 。 


3.2.4 ” 按 服 务 器 用 途 划分 


1. 通用 型 服务 器 
通用 型 服务 器 是 可 以 提供 各 种 服务 功能 的 服务 器 ， 目 前 大 多 数 服 务 器 都 是 通用 型 服 
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务 器 。 由 于 这 类 服务 器 不 是 为 实现 某 一 功能 而 专门 设计 的 ， 所 以 在 设计 时 ， 需 要 兼顾 多 
方面 的 应 用 需求 ， 服 务 器 的 结构 较为 复杂 ， 且 要 求 性 能 较 高 ， 价 格 也 较为 昂贵 。 

2. 专用 型 服务 器 

专用 型 服务 器 是 为 实现 某 些 功能 而 专门 设计 的 服务 器 。 因 此 ， 在 某 些 方面 与 通用 型 
服务 器 有 着 较 大 的 不 同 。 例 如 FTP 服务 器 主要 用 于 网 络 文件 传输 ， 这 要 求 服务 器 在 存储 
介质 的 稳定 性 、 存 取 速 度 、 网 络 带宽 方面 具有 较 大 的 优势 。 而 电子 邮件 服务 器 主要 是 要 
求 服务 器 配置 高 宽带 、 大 容量 并 带 有 容错 能 力 的 磁盘 。 这 些 专用 型 服务 器 的 性 能 要 求 比 
较 低 ， 因 为 它 只 要 能 够 实现 需要 的 应 用 即 可 ， 所 以 结构 较为 简单 ， 在 稳定 性 、 扩 展 性 等 
方面 要 求 不 高 。 


3.2.5” 按 服务 器 的 机 箱 结构 划分 


1， 类 型 
按照 服务 器 的 机 箱 结构 ， 通 常 可 以 划分 为 如 下 类 型 。 
。 台式 服务 器 。 
机 架 式 服 务 器 。 
机 柜 式 服务 器 。 
刀片 式 服 务 器 。 
模块 化 服务 器 。 
.介绍 

各 种 服务 器 的 介绍 如 下 。 

(1) 台式 服务 器 

台式 服务 器 通常 也 被 称 为 “ 塔 式 服务 器 ”。 台 式 服务 器 大 多 是 较为 低 端 的 服务 器 ， 
由 于 低 端 服务 器 功能 较 弱 ， 内 部 结构 较为 简单 ， 因 此 体积 不 大 ， 故 使 用 台式 机 箱 的 结构 
进行 设计 。 此 外 ， 立 式 机 箱 也 属于 台式 机 范围 ， 目 前 这 类 服务 器 在 整个 服务 器 市 场 中 占 
有 相当 大 的 份额 。 

(2) 机 架 式 服务 器 

机 架 式 服务 器 有 1U (1U=4.45cm)、2U、4U 等 规格 ， 安 装 在 标准 的 19 英寸 机 柜 里 
面 。 目前， 机 架 式 服 务 器 多 为 专用 型 服务 器 。 

机 架 式 服 务 器 的 设计 ， 是 为 了 满足 大 多 数 大 型 企业 的 需要 。 对 于 这 些 企 业 而 言 ， 服 
务 器 是 放置 在 机 房 中 进行 统一 管理 与 维护 的 。 机 房 具有 良好 的 服务 器 运行 环境 ， 如 气温 
与 湿度 控制 、 具 有 备份 的 电力 供应 、 防 火 防 震 等 ， 这 些 条 件 使 得 机 房 的 建筑 成 本 极 高 ， 
因此 对 于 较 多 的 大 型 企业 而 言 ， 服 务 器 需要 有 尽 可 能 小 的 体积 以 及 适宜 的 形状 ， 使 固定 
大 小 的 机 房 能 够 放置 尽 可 能 多 的 服务 器 。 

1U 的 机 架 服务 器 如 图 3-1 所 示 。 
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图 3-1 1U 机 架 服务 器 
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2U 的 机 架 服 务 器 如 图 3-2 所 示 。 

(3) 机柜 式 服务 器 

对 于 一 些 高 端 服务 器 而 言 ， 由 于 服务 器 功能 强大 ， 因 此 在 服务 器 设计 的 过 程 中 ， 不 
免 会 集成 较 多 的 内 部 设备 ， 从 而 使 得 服务 器 的 内 部 结构 复杂 而 庞大 ， 甚 至 有 时 还 具有 许 
多 不 同 的 设备 单元 或 几 个 服务 器 需要 放置 在 一 起 ， 这 样 的 服务 器 需要 一 个 特殊 的 设 
备 一 一 机 柜 来 放置 ， 而 这 种 服务 器 就 是 机 柜 式 服务 器 。 

机 柜 服 务 器 具有 完备 的 故障 目 修复 能 力 的 系统 ， 关 键 部 件 采 用 了 元 余 的 设计 ， 甚 至 
对 于 一 些 关键 的 业务 ， 可 以 采用 双 机 热 备 份 高 可 用 系统 或 者 高 性 能 计算 机 ， 从 而 提高 服 
务 器 的 可 用 性 与 可 靠 性 。 

(4) 刀片 式 服务 器 

一 般 而 言 ， 服 务 器 的 功能 越 强 大 ， 拥 有 的 部 件 越 多 ， 绪 构 越 复杂 ， 因 此 体积 也 越 庞 
大 。 实 际 上 ， 服 务 器 内 部 的 部 件 密度 并 没有 随 着 服务 器 性 能 的 提升 而 增 大 ， 因 此 ， 提 升 
服务 器 内 部 组 件 的 密度 ， 可 以 得 到 一 种 具有 高 密度 计算 机 环境 的 服务 器 。 

刀片 式 服务 器 是 一 种 高 可 用 高 密度 (high availability high density, HAHD) 的 低 成 
本 服务 器 。 在 这 类 服务 器 中 存在 多 块 “ 刀 片 ” 每 一 块 “ 刀 片 ” 实际 上 都 是 一 块 系统 主板 ， 
因此 可 以 将 刀片 视 为 一 个 个 独立 的 服务 器 ， 而 刀片 服务 器 本 身 则 是 数 个 服务 器 的 集合 。 
每 一 块 刀片 作为 一 个 独立 的 服务 器 ， 可 以 独立 地 运行 并 为 用 户 提 供 服务 。 此 外 ， 刀 片 服 
务 器 可 以 将 所 有 的 刀片 整合 在 一 起 ， 形 成 一 个 大 的 集群 系统 ， 利 用 高 速 的 网 络 环境 ， 可 
以 统一 协调 地 工作 ， 为 用 户 群 提供 统一 的 服务 。 

刀片 服务 器 整 机 图 如 图 3-3 所 示 。 





图 3-2 2U 机 柜 服 务 器 图 3-3 刀片 服务 器 整 机 图 


(5) 模块 化 服务 器 

模块 化 服务 器 是 Intel 与 联想 、 浪 潮 、 航 天 联 志 〈Aisino) 等 国内 知名 服务 器 厂商 推 
出 的 基于 SSI 的 服务 器 产品 。 在 整合 性 、 扩 展 性 等 方面 ， 模 块 化 服务 器 具备 刀片 服务 器 
所 具备 的 优势 ， 此 外 在 价格 上 ， 模 块 化 服务 器 具有 更 大 的 竞争 力 。 

模块 化 服务 器 将 服务 器 的 各 项 功能 ， 如 存储 、 计 算 、 网 络 、 管 理 等 模块 化 ， 从 而 形 
成 独立 的 功能 单元 ， 并 通过 一 个 独立 的 管理 模块 对 各 个 功能 单元 进行 管理 。 目 前 ， 刀 片 
服务 器 的 设计 理念 依然 处 于 主导 地 位 ， 然 而 随 着 模块 化 服务 器 的 推出 ， 虽 然 在 高 元 余 、 
高 可 靠 性 等 方面 ， 刀 片 服务 器 依然 保持 着 较 大 的 优势 ， 但 在 整合 性 、 扩 展 性 以 及 管理 、 
安装 等 方面 ， 模 块 化 服务 器 却 不 输 于 刀片 服务 器 。 
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3.3 ”处 理 器 的 发 展 与 技术 


3.3.1 处理 器 概述 


”CPU 是 服务 器 上 的 核心 处 理 单元 ， 而 服务 器 是 网 络 中 的 重要 设备 ， 要 处 理 大 量 的 访 
问 需 求 。 因 此 ， 对 服务 器 所 承担 的 巨大 的 工作 负担 ， 实 际 上 可 以 转变 为 对 CPU 处 理 能 力 
的 要 求 。 可 以 说 CPU 是 服务 器 最 为 核心 的 一 部 分 ， 是 制约 服务 器 性 能 提升 的 关键 因素 。 

目前 ， 服 务 器 的 CPU 类 型 根据 CPU 的 指令 系统 ， 通 常 分 为 CISC 型 、RISC 型 和 
VLIM 型 的 CPU。 


3.3.2 ”常见 的 处 理 器 


1. CISC 型 CPU 
CISC 是 英文 “complex instruction set computer” 的 缩写 ， 中 文 意思 是 “复杂 指令 集 
计算 机 ” 目前, 较 多 的 处 理 器 (CPU) 厂商 一 直 在 研发 CISC 处 理 器 , 包括 Intel, AMD, 
还 有 其 他 一 些 现在 已 经 更 名 的 厂商 ， 如 TI (德州 仪器 )、Cyrix 以 及 VIA (威盛 ) 等 。 在 
CISC 处 理 器 中 ， 程 序 的 各 条 指令 ， 以 及 每 条 指令 中 的 各 个 操作 都 是 按 顺序 串 行 执行 的 。 
顺序 执行 的 优点 在 于 易于 设计 、 控 制 简单 ， 但 计算 机 各 部 分 的 利用 率 不 高 ， 执 行 速度 组 
慢 。CISC 处 理 器 大 多 为 英特尔 生产 的 x86 (Intel CPU 的 一 种 命名 规范 ) 系列 CPU 及 其 
兼容 CPU 〈 其 他 厂商 如 AMD. VIA 等 生产 的 CPU)。 这 种 CPU 一 般 都 是 32 位 的 结构 ， 
所 以 也 称 其 为 IA-32 CPU (IA: Intel Architecture, Intel 架构 )。 
2. RISC 型 CPU 
RISC 是 英文 “reduced instruction set computing” 的 缩写 ， 中 文 意思 是 “精简 指令 集 
计算 机 ”。 它 是 在 CISC 的 基础 上 发 展 起 来 的 。 相 比 于 上 面 提 到 的 CISC， 它 的 指令 集 较 
为 简单 , 因为 它 只 要 求 处 理 器 执行 简单 的 指令 , 其 余 的 复杂 操作 则 使 用 成 熟 的 编译 技术 ， 
由 简单 指令 合成 。 除 精简 指令 集 以 外 ，RISC 处 理 器 还 采用 了 超标 量 和 超 流 水 线 的 技术 ， 
大 大 增加 了 并 行 处 理 能 力 。 也 就 是 说 , 在 同样 的 时 钟 周期 下 , RISC 处 理 器 的 性 能 比 CISC 
处 理 器 高 出 很 多 。 目 前 中 高 档 服务 器 大 多 采用 RISC 处 理 器 ， 特 别 是 高 档 服 务 器 ， 全 都 
采用 了 RISC 处 理 器 。RISC 指令 集 更 加 适合 高 档 服务 器 的 操作 系统 UNIX 与 Linux。 但 
是 ，RISC 处 理 器 与 Intel 和 AMD 的 CPU 在 软件 和 硬件 上 都 不 兼容 。 
目前 ， 在 中 高 档 服务 器 中 采用 RISC 指令 的 CPU 主要 有 以 下 几 类 。 
PowerPC 处 理 器 。 
SPARC 处 理 器 。 
PA-RISC 处 理 器 。 
MIPS 处 理 器 。 
Alpha Xb## 4% o 
. VLIW 型 CPU 
VLIW 简化 了 处 理 器 的 结构 , 去 除了 处 理 器 内 部 许多 对 于 CISC 与 RISC 而 言 必须 的 
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复杂 的 控制 电路 ,因此 ,VLIW 简单 的 结构 也 使 其 局 片 的 制造 成 本 与 能 耗 降低 , 使 得 VEIW 
处 理 器 价格 低廉 ， 能 耗 低 ， 而 性 能 确 比 超标 量 处 理 器 高 出 许多 。 

最 后 值得 注意 的 是 , 虽然 CPU 是 决定 服务 器 性 能 最 重要 的 因素 之 一 , 但 是 如 果 没 有 
其 他 配件 的 支持 和 配合 ，CPU 也 不 能 发 挥 出 它 应 有 的 性 能 。 


3.4 内 存 的 发 展 与 技术 


3.4.1 ”内存 概述 


服务 器 内 存 (memory) 是 用 来 存储 服务 器 程序 和 数据 的 部 件 。 内 存 就 是 服务 器 主板 
上 的 存储 部 件 ，CPU 直接 与 之 沟通 、 存 放 当 前 正在 使 用 的 数据 和 程序 ， 它 的 物理 实质 就 
是 一 组 或 多 组 具备 数据 输入 输出 和 数据 存储 功能 的 集成 电路 。 

内 存 性 能 对 服务 器 性 能 有 着 极为 重要 的 影响 。 作 为 一 种 高 速 器 件 ， 内 存 很 容易 发 生 
各 种 各 样 的 错误 。 因 此 ， 为 了 避免 内 存 错误 给 服务 器 带 来 的 影响 ， 各 个 厂商 都 积极 推出 
目 己 独特 的 服务 器 内 存 技术 。 例 如 , HP 的 在 线 备份 内 存 技 术 与 热 插 拔 镜像 内 存 技 术 ; IBM 
的 ChipKill 内 存 技 术 、 热 更 换 和 热 增 加 内 存 技术 等 。 而 且 随 着 服务 器 功能 的 扩展 与 处 理 
能 力 的 增强 ， 内 存 的 密度 和 容量 也 将 得 到 相应 的 发 展 。 


3.4.2 BIAFRA 


1. Advanced ECC Memory 

目前 ， 服 务 器 几乎 都 需要 24 小 时 不 间断 运行 ， 因 此 服务 器 对 可 靠 性 和 稳定 性 的 要 求 极 
为 严格 。 为 了 避免 内 存 出 错 影响 服务 器 工作 ，ECC 指令 纠 错 技术 应 运 而 生 。 需 要 注意 的 是 ， 
ECC 并 不 是 一 种 内 存 型 号 ， 也 不 是 一 种 内 存 专 用 技术 ， 而 是 一 种 广泛 应 用 的 指令 纠 错 技术 。 

错误 检查 和 纠正 〈error checking and correcting, ECC) 是 为 了 弥补 同位 检查 码 的 缺 
陷 而 产生 的 一 种 内 存 纠 错 技术 ，ECC 可 以 发 现 并 纠正 错误 。 比 起 奇偶 校 验 技术 ， 它 更 为 
先进 ， 因 为 它 不 仅 可 以 发 现 错误 ,还 能 够 纠正 这 些 错 误 ， 从 而 保证 服务 器 能 够 正常 工作 ， 
不 受 内 存 错误 的 影响 。 

2. Chipkill 技术 

Chipkill 技术 是 由 IBM 公司 开发 的 , 为 了 弥补 目前 应 用 于 服务 器 内 存 的 ECC 技术 的 
不 足 的 一 项 技术 。 实 际 上 ， 它 是 一 种 新 的 ECC 内 存 保 护 标 准 ， 由 于 ECC 只 能 检测 和 纠 
正 一 位 的 错误 ， 因 此 当 两 个 或 两 个 以 上 的 位 错误 被 同时 检测 到 时 ，ECC 就 无 法 对 错误 进 
行 纠正 。 而 Chipkill 技术 利用 了 类 似 于 磁盘 阵列 中 奇偶 检验 的 存储 保护 思想 ， 在 写 数据 
时 ， 将 数据 写 到 多 块 内 存 芯片 上 。 这 样 ， 每 块 芯片 所 起 的 作用 实际 上 与 存储 阵列 中 每 一 
块 磁盘 的 作用 类 似 。 如 果 其 中 的 一 块 芯片 失效 了 ， 因 为 其 余 的 位 存储 在 另外 的 芯片 上 ， 
所 以 只 有 字 节 上 的 某 一 位 会 受到 影响 。 出 现 错误 后 ， 内 存 控制 器 能 够 从 失效 的 芯片 重新 
构造 丢失 的 数据 ， 从 而 使 服务 器 继续 工作 。 采 用 Chipkill 技术 的 内 存 可 以 同时 检测 并 纠 
E 4 个 错误 的 数据 位 ， 比 起 ECC， 进 一 步 提 高 了 服务 器 的 可 靠 性 与 稳定 性 。 

目前 ， 虽 然 服 务 器 处 理 器 的 性 能 飞速 提升 ， 但 磁盘 的 读 写 性 能 增长 缓慢 ， 因 此 ， 为 
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了 整体 提升 服务 器 的 性 能 ， 需 要 大 量 的 内 存 来 临时 保存 处 理 器 需要 读 取 的 数据 ， 即 将 内 
存 用 作 磁 盘 的 缓存 。 但 是 服务 器 所 具有 的 大 量 数据 访问 操作 ， 要 求 单一 的 内 存 芯 片 在 每 
次 访问 时 能 够 提供 4 字 节 或 8 字 节 ， 甚 至 更 多 的 数据 。 一 次 性 读 取 如 此 大 量 的 数据 大 大 
提高 了 多 位 数据 出 现 错误 的 概率 , 而 ECC 只 能 纠正 一 位 的 错误 , 这 样 就 很 可 能 造成 全 部 
数据 丢失 ， 从 而 使 系统 崩 演 。Chipkill 技术 则 利用 了 内 存 的 子 结构 来 解决 这 一 问题 。 内 
存 子 系统 的 设计 原理 为 : 对 于 单一 芯片 ， 无 论 数据 宽度 是 多 少 ， 只 对 应 一 个 给 定 的 ECC 
识别 码 ， 它 的 影响 最 多 为 一 位 。 例 如 ， 如 果 使 用 4 位 的 DRAM，4 位 中 每 一 位 的 奇偶 性 将 
分 别 组 成 不 同 的 ECC 识别 码 ， 这 个 ECC 识别 码 是 用 单独 一 个 数据 位 来 保存 的 ， 也 就 是 说 
保存 在 不 同 的 内 存 空间 地 址 中 。 因 此 ， 即 使 整个 内 存 芯 片 出 了 故障 ， 每 个 ECC 识别 码 也 
将 最 多 出 现 Ibit 坏 数据 ， 而 这 种 情况 完全 可 以 通过 ECC 逻辑 修复 ， 从 而 保证 内 存 子 系统 
的 容错 性 ， 保 证 了 服务 器 在 出 现 故 障 时 ， 有 强大 的 自我 恢复 能 力 。 采 用 这 种 内 存 技术 的 内 
存 可 以 同时 检查 并 修复 4 个 错误 数据 位 ， 服 务 器 的 可 靠 性 和 稳定 性 得 到 了 更 加 充分 的 保障 。 

比 起 ECC 技术 ，Chipkill 技术 更 加 有 效 ， 对 于 每 块 内 存 芯 片 ， 它 拥有 纠正 4 位 错误 
的 能 力 。 如 果 内 存 发 生 错误 ，Chipkill 技术 就 能 够 迅速 地 恢复 数据 ， 从 而 保证 服务 器 能 
够 正常 工作 。 

3. 镜像 内 存 ( mirrored memory ) 技术 

mirrored memory 的 工作 原理 与 硬盘 的 热 备 份 类 似 , 内 存 镜像 是 将 内 存 数据 做 两 个 拷 
贝 ， 分 别 放 在 主 内 存 和 镜像 内 存 中 。 当 某 个 内 存 芯 片 失效 时 ， 镜 像 保 护 技 术 能 够 目 动 利 
用 备用 的 比特 位 找 回 数据 。 由 于 采用 通道 间 交 叉 镜像 的 方式 ， 所 以 每 个 通道 都 有 一 套 完 
整 的 内 存 数据 拷贝 ， 从 而 保证 服务 器 的 平稳 运行 。 

4. WIER RAID 内 存 技术 

热 插 拔 RAID 内 存 技术 与 硬盘 的 RAID 技术 类 似 , 可 以 利用 比 mirrored memory 少 很 
多 的 容量 来 实现 类 似 于 mirrored memory 的 功能 ,需要 热 插 拔 内 存 板 的 支持 。 热 插 拔 RAID 
内 存 Chot plug RAID memory) 技术 类 似 于 RAID 4 的 存储 技术 ， 它 在 系统 架构 上 更 像 磁 
fia, Flt, SRAM ST Ada RAID 内 存 技术 的 系统 可 以 像 RAID 一 样 ， 随 意 蔡 换 内 存 。 但 
是 ， 热 插 拔 RAID 内 存 与 RAID 之 间 依 然 存 在 着 不 同 之 处 ， 例 如 ， 在 性 能 上 会 有 不 同 ， 
而 两 者 的 实现 方式 也 不 一 样 。 不 同 于 RAID, Hii RAID 内 存 使 用 并 行 的 点 对 点 连接 
方式 写 入 数据 ， 而 不 是 像 磁 盘 阵列 一 样 ， 通 过 连接 多 块 磁盘 的 串 行 总 线 来 写 入 数据 ， 这 
种 方式 的 优点 在 于 , 数据 可 以 同时 被 写 入 多 个 存储 区 , 不 存在 延 时 ， 从 而 消除 了 因 RAID 
技术 存在 的 写 数据 的 瓶颈 问题 。RAID memory 原理 如 图 3-4 所 示 。 


3-4 RAID memory 原理 示意 图 
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3.5 ”服务 器 I/O BA 


3.5.1 VO 总 线 概述 


总 线 (bus) 是 处 理 器 与 外 部 设备 连接 通信 和 的 通道 。 处理 器 工作 时 需要 与 外 部 设备 进 
行 数据 、 控 制 信号 等 信息 交换 ， 但 是 假如 每 种 设备 都 分 别 引 入 一 组 线路 与 处 理 器 直接 连 
接 ， 那 么 系统 线路 会 变 得 极其 复杂 、 无 序 ， 且 不 易 维护 ， 因 此 ， 一 组 通用 线路 被 设计 用 
于 实现 处 理 器 与 外 部 设备 之 间 的 连接 ， 它 给 不 同 的 设备 提供 了 相对 统一 的 接口 ， 从 而 大 
大 简化 了 处 理 器 同 外 部 设备 进行 信息 交换 的 过 程 ， 提 高 了 工作 效率 。 根 据 所 连接 设备 的 
不 同 ， 总 线 可 分 为 内 部 总 线 、 系 统 总 线 和 外 部 总 线 。 内 部 总 线 用 于 连接 处 理 器 与 系统 内 
部 必 片 ， 系 统 总 线 用 于 连接 主板 、 扩 展 卡 等 ， 外 部 总 线 则 用 于 连接 系统 与 外 部 设备 。 


3.5.2 ”常见 的 VO BARA 


1. SCSI 技术 

小 型 计算 机 系统 接口 (small computer system interface, SCSI) 是 一 种 用 于 计算 机 和 
智能 设备 ( 人 硬盘、 软驱、 光驱、 打印 机 、 扫 描 仪 等 ) 之 间 系 统 级 接口 的 独立 处 理 器 标准 。 
SCSI 是 一 种 智能 的 通用 接口 标准 。 它 是 各 种 计算 机 与 外 部 设备 之 间 的 接口 标准 。 

(1) SCSI 接口 是 一 个 通用 接口 ， 在 SCSI 母线 上 可 以 连接 主机 适配器 和 8 个 SCSI 
外 设 控制 器 ， 外 设 可 以 包 插 磁盘、 磁带、CD-ROM、 可 擦 写 光 盘 驱 动 器 、 打 印 机 、 扫 描 
仪 和 通信 设备 等 。 

(2) SCSI 是 个 多 任务 接口 ， 设 有 母线 仲裁 功能 。 挂 在 一 个 SCSI 母线 上 的 多 个 外 设 
可 以 同时 工作 。SCSI 上 的 设备 平等 占有 总 线 。 

(3) SCSI 接口 可 以 同步 或 异步 传输 数据 ， 同 步 传 输 速率 可 以 达到 10MB/s， 异 步 传 
输 速率 可 以 达到 1.5MB/s。 

(4) SCSI 接口 接 到 外 置 设备 时 ， 它 的 连接 电缆 可 以 长 达 6m。 

2. PCI-X 总 线 技术 

PCI-X 是 由 IBM、HP 和 Compaq 公司 提出 来 的 ， 它 是 并 行 接口 ， 是 PCI KBE, 3 
容 PCI。 

PCI 总 线 的 时 钟 频率 是 33Mhz， 总 线 宽度 32 位 ， 理 论 传输 速率 可 以 达到 132MB/s. 

PCI-X 总 线 宽度 达到 了 64 位 ， 总 线 频率 最 高 可 以 达到 133MHz， 理 论 传输 速率 达到 
64 位 *133MHz=1GB/s， 而 PCI-X 2.0 (PCI-X 266) 版 本 在 时 钟 的 上 升 和 下 降 沿 均 可 传输 
数据 ， 是 PCI-X 理论 速度 的 二 倍 ， 可 以 到 达 达 到 2.1GB/s 

3. PCI-E 总 线 技 术 

2002 年 公布 的 “PCI Express” 是 一 个 新 的 总 线 标准 。 这 个 新 的 总 线 标准 将 全 面 取代 
现行 的 PCI 和 AGP 总 线 ， 最 终 实现 总 线 标准 的 统一 。 它 的 主要 优势 就 是 数据 传输 速率 
高 ， 目 前 最 高 可 达到 10GB/s 以 上 ， 而 且 还 有 相当 大 的 发 展 潜力 。 

PCI-E (PCI-Express) 采用 了 目前 较为 流行 的 点 对 点 串 行 连接 的 方式 ， 相 比 PCI 以 
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及 更 早期 的 计算 机 总 线 所 采用 的 共享 并 行 架 构 ，PCI-E 所 连接 的 每 个 设备 都 有 专用 的 连 
接 通 路 ， 不 需要 向 整个 总 线 请 求 带 宽 ， 因 此 ， 可 以 达到 很 高 的 信道 频率 ， 提 升 数据 传输 
速率 ， 从 而 提供 PCI 所 不 能 提供 的 高 带宽 。 此 外 ， 相 对 于 传统 PCI 总 线 的 半 双 工 传输 方 
式 ，PCI-E 的 双 工 连接 能 够 提供 更 高 的 数据 传输 速率 ， 并 能 更 好 地 保证 数据 传输 的 质量 。 

PCI-Express 总 线 标准 之 所 以 能 够 迅速 地 得 到 业界 的 承认 , 并 且 被 业界 公认 为 下 一 个 
10 年 的 总 线 标准 ， 是 因为 它 具备 鲜明 的 技术 特点 ，Intel 在 开发 PCI-E 时 就 充分 考虑 到 
PCI 目前 存在 的 各 种 问题 ， 并 就 此 进行 了 充分 的 完善 和 优化 。 这 些 改进 包括 采用 智能 化 
总 线 架 构 、 支 持 多 种 不 同 设 备 、 解 决 资源 共享 问题 、 增 强 技 术 可 靠 性 和 极 大 提高 带宽 等 
方面 ， 这 些 技术 改进 可 以 全 面 解决 PCI 总 线 技术 面临 的 种 种 问题 ， 从 而 PCI-E 被 认为 是 
PCI 真正 的 替代 者 。 

4. InfiniBand 总 线 

InfiniBand 是 一 个 能 够 在 相对 较 短 的 距离 内 提供 高 带宽 、 低 延迟 的 数据 传输 服务 ， 
并 支持 元 余 VO 通道 的 统一 互 连 结构 。 磁 盘 阵 列 、SAN、LAN、 外 部 网 络 、 服 务 器 和 集 
群 系统 等 可 以 通过 InfiniBand 进行 连接 。 

InfiniBand 与 现存 的 VO 技术 在 许多 重要 的 方面 都 不 相同 。 不 同 于 传统 共享 总 线 ， 
InfiniBand 没有 相关 的 电子 限制 、 仲 裁 冲 突 和 内 存 一 致 性 问题 。InfiniBand 在 交换 式 互 连 
网 络 上 ， 采 用 点 到 点 的 、 基 于 通道 的 消息 转发 模型 ， 同 时 ， 采 用 网 络 架 构 能 够 为 多 个 不 
同 的 节点 提供 多 种 可 能 的 通道 。 


3.6 ”服务 器 RAID 技术 


3.6.1 RAID 概述 


独立 磁盘 见 余 阵列 (redundant array of independent disks, RAID) 是 一 种 将 多 块 独立 
的 硬盘 按 不 同方 式 组 合 起 来 形成 一 个 硬盘 组 ， 从 而 提供 比 单 个 硬盘 更 高 的 存储 性 能 和 提 
供 数 据 元 余 的 技术 。 

在 服务 器 上 使 用 RAID 技术 是 为 服务 器 的 数据 提供 元 余 的 保障 。 同 时 ， 由 于 磁盘 存 
取 速 度 的 提升 跟 不 上 CPU 处 理 速度 的 发 展 ， 从 而 成 为 提高 服务 器 IO 能 力 的 一 个 瓶颈 。 
RAID 技术 利用 条 带 技 术 提 高 磁盘 存 取 速度 ， 同 时 使 用 数据 见 余 技术 提供 磁盘 数据 备份 ， 
提高 了 系统 可 靠 性 。 常 用 的 服务 器 RAID 级 别 有 : RAID0、RAID1、RAID3、RAID5、 
RAID6、RAID10、RAID50， 不 同 RAID 级 别 代表 不 同 的 存储 性 能 、 数 据 安 全 性 和 存储 
成 本 。 


3.6.2 ”服务 器 RAID Æ 


RAID 卡 就 是 用 来 实现 RAID 功能 的 板 卡 ， 通 常 由 1/O 处 理 器 、SCSI 控制 器 、SCSI 
连接 器 和 缓存 等 一 系列 组 件 构 成 。 RAID 卡 的 基本 功能 是 可 以 让 很 多 磁盘 驱动 器 同时 传 
输 数 据 ， 而 这 些 磁盘 驱动 器 在 逻辑 上 又 是 一 个 磁盘 驱动 器 ， 因 此 使 用 RAID 可 以 达到 单 
个 磁盘 驱动 器 数 十 倍 的 速率 。RAID 卡 的 男 一 个 重要 功能 就 是 可 以 提供 RAID 的 容错 功 
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能 。 根 据 对 元 余 度 和 性 能 的 不 同 需求 ，RAID 被 分 为 多 个 等 级 : RAID 0~RAID 6， 等 等 。 
每 一 个 等 级 在 可 靠 性 、 有 效 性 、 性 能 、 容 量 之 间 有 着 不 同 的 权衡 。 不 同 的 RAID 卡 文 持 
的 RAID 等 级 和 功能 有 所 区 分 。 

RAID 卡 支持 的 硬盘 接口 ， 目 前 主要 有 3 种 : IDE 接口 、SCSI 接口 和 SATA 接口 。 

1. IDE 接口 

电子 集成 驱动 器 (integrated drive electronics, IDE) 这 一 接口 技术 从 诞生 至 今 就 一 
直 在 不 断 发 展 ， 性 能 也 不 断 提高 ， 其 拥有 价格 低廉 、 兼 容 性 强 的 特点 ， 在 SATA 出 现 之 
BU, IDE 在 桌面 电脑 中 保持 了 无 法 蔡 代 的 地 位 。 

IDE 代表 着 硬盘 的 一 种 类 型 ， 但 在 实际 应 用 中 ， 人 们 也 习惯 用 IDE 来 称呼 最 早出 现 
的 IDE 类 型 硬盘 ATA-1， 这 种 类 型 的 接口 随 着 接口 技术 的 发 展 已 经 被 淘汰 了 ， 而 其 后 发 
展 分 支出 更 多 类 型 的 硬盘 接口 ， 如 ATA, Ultra ATA, DMA, Ultra DMA 等 接口 都 属于 
IDE 硬盘 。IDE RAID 卡 外 观 如 图 3-5 所 示 。 

2. SATA 接口 

使 用 SATA (serial ATA) 接口 的 硬盘 又 叫 串口 硬盘 。2001 Æ, H Intel. APT. Dell, 
IBM, AiE, DHELA RAR Serial ATA 委员 会 正式 确立 了 Serial ATA1.0 规范 。 

Serial ATA 采用 串 行 连接 方式 ， 串 行 ATA 总 线 使 用 杠 入 式 时 钟 信号 ， 具 备 了 更 强 的 
纠 错 能 力 ，SATA 能 对 传输 指令 进行 检查 ， 发 现 错误 会 自动 纠 错 ， 这 大 大 提高 了 数据 传 
输 的 可 靠 性 。 串 行 接口 还 具有 结构 简单 、 文 持 热 插 拔 等 优点 。SAIA RAID 卡 的 外 观 如 图 
3-6 所 示 。 


mon 





图 3-5 IDE RAID 卡 的 外 观 3-6 SATARAID 卡 的 外 观 


3. SCSI 接口 

小 型 计算 机 系统 接口 (small computer system 
interface, SCSI) 是 与 IDE 完全 不 同 的 接口 。SCSI 
接口 具有 应 用 范围 广 、 多 任务 、 带 宽大 、CPU 占 
用 率 低 以 及 支持 热 插 拔 等 优点 ， 但 其 价格 较 高 ， 
且 由 于 串 行 总 线 技术 相 较 于 并 行 总 线 技术 的 优 
势 ，SCSI 接口 硬盘 目前 已 被 SAS WAR. SCSI 
RAID 卡 外 观 如 图 3-7 所 示 。 





图 3-7 SCSI RAID 卡 的 外 观 
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3.7 ”服务 器 高 级 技术 与 发 展 


3.7.1 ”服务 器 的 智能 监控 管理 技术 


服务 器 的 智能 监控 管理 技术 不 是 一 个 单一 的 服务 器 技术 ， 它 是 一 系列 智能 管理 技术 
的 总 称 ， 其 中 包括 EMP 应急 管理 端口 )、、ISM Onte 服务 器 管理 )、IPMI (智能 平台 管 
理 接 口 ) 和 SNMP 《简单 网 络 管理 协议 ) 等 技术 。 

把 服务 器 的 智能 监控 管理 技术 应 用 于 服务 器 管理 软件 ， 业 界 开发 出 很 多 的 配套 服务 
器 的 管理 软件 。 例如 戴尔 的 OpeManage 4、IBM Tivoli, HP Openview， 华 为 公司 的 iBMC 
(Intelligence Baseboard Management Controller) 及 浪潮 的 LCSMS 等 。 第 三 方 软件 如 
Symantec 公司 的 OpForce 3.0 和 TurboLinux 公司 的 Linux 服务 器 管理 软件 等 。 

1. EMP 

应 急 管理 端口 (emergency management port, EMP) 是 一 个 用 于 远程 管理 服务 器 的 
接口 。 安 装 控制 软件 之 后 ， 远 程控 制 机 可 以 通过 调制 解 调 器 与 服务 器 相连 。 通 过 EMP 
Console 控制 界面 ， 远 程控 制 机 可 以 对 服务 器 进行 以 下 操作 。 

C1) 开局 或 者 切断 服务 器 的 电源 。 

(2) 重 置 服务 器 ， 包 括 主板 BIOS 和 CMOS 的 参数 设置 等 。 

(3) 监测 服务 器 的 温度 、 电 压 、 风 扇 等 内 部 情况 。 

以 上 功能 可 以 使 技术 支持 人 员 远 程 通过 Modem (调制 解 调 器) 和 电话 线 及 时 解决 服 
务 器 的 许多 硬件 故障 。 这 是 一 种 很 好 的 实现 快速 服务 和 节省 维护 费用 的 技术 手段 。 

2. ISM 

ISM (Intel Server Management, Intel 服务 器 管理 ) 是 一 种 适用 于 Intel 架构 的 ， 主 板 
市 有 集成 管理 功能 的 服务 器 的 网 络 监 控 技 术 。 通 过 该 技术 ， 用 户 可 以 使 用 普通 的 客户 机 
对 服务 器 进行 一 定 程 度 的 操作 。 例 如 ， 可 以 通过 网 络 对 服务 器 电源 进行 开启 或 切断 ， 可 
以 配置 服务 器 的 BIOS 参数 ， 可 以 监控 网 络 上 所 有 使 用 该 技术 的 服务 器 的 运行 状况 。 

3. IPMI 

智能 型 平台 管理 接口 (Intelligent Platform Management Interface, IPMI) 是 一 种 工业 
标准 ， 用 于 管理 Intel 架构 的 企业 系统 的 外 部 设备 ， 该 标准 由 英特尔 、 惠 普 、NEC、 戴 尔 
和 SuperMicro 等 公司 制定 。 通 过 IPMI， 用 户 可 以 监视 服务 器 的 内 部 状况 ， 如 温度 、 电 
压 、 风 书 工 作 状 态 、 电 源 状态 等 ， 从 而 获知 服务 器 的 工作 状态 。 此 外 ，IPMI 是 一 个 开放 
的 免费 标准 ， 用 户 无 需 为 使 用 该 标准 而 支付 额外 的 费用 ， 从 而 降低 了 服务 器 的 运行 与 维 
护 成 本 。 

IPMI 的 核心 是 基板 管理 控制 器 (baseboard management controler, BMC). BMC 是 
一 个 独立 于 服务 器 的 处 理 器 、BIOS 与 操作 系统 的 元 件 ， 它 可 以 在 系统 内 独立 地 运行 ， 
是 一 个 无 代理 管理 的 子 系统 ， 只 要 有 BMC 与 IPMI 固件 ， 便 可 以 工作 。 通 常 ，BMC 是 
一 个 安装 在 服务 器 主板 上 的 独立 板 卡 ， 目 前 也 有 部 分 服务 器 主板 直接 提供 对 IPMI 的 支 
持 sBMC 所 具有 的 独立 运行 的 特点 使 得 PMI 摆脱 了 基于 操作 系统 管理 方式 带 来 的 限制 。 
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一 般 来 说 ，BMC 具有 以 下 功能 。 

C1) 通过 系统 的 串 行 端口 进行 访问 。 

(2) 访问 系统 事件 日 志和 传感器 状况 。 

(3) 记录 故障 日 志和 发 送 SNMP EIR. 

(4) 开局 与 关闭 服务 。 

(5) 不 受 系 统 电源 与 工作 状态 的 限制 。 

(6) 文本 控制 台 重 定 问 。 

4. SNMP 

简单 网 络 管理 协议 (simple network management protocol, SNMP) 是 在 简单 网 关 监 
控 协议 (simple gateway monitoring protocol, SGMP) 的 基础 上 发 展 起 来 的 。 由 于 SNMP 
的 目标 是 管理 互联 网 上 众多 厂家 生产 的 软 人 硬件 平台 ， 因 此 SNMP 2% Internet 标准 网 络 管 
理 框架 的 影响 也 很 大 。 

SNMP 主要 有 以 下 4 个 特点 。 

(1) 管理 代理 的 软件 成 本 低 。 

(2) 远程 管理 的 功能 强大 。 

(3) 体系 结构 具有 较 好 的 可 扩展 性 。 

(4) 具有 较 强 的 独立 性 ， 不 依赖 于 具体 的 计算 机 、 服 务 器 、 网 关 和 网 络 传输 协议 。 


3.7.2 ”服务 器 的 安全 保护 技术 


现在 服务 器 中 存储 的 信息 越 来 越 多 ， 也 越 来 越 重 要 。 为 防止 服务 器 因 发 生意 外 或 受 
到 意外 攻击 而 丢失 大 量 重要 的 数据 ， 服 务 器 一 般 部 会 采用 许多 重要 的 安全 你 护 技术 来 确 
保 其 安全 。 下 面 介绍 一 些 主要 的 服务 器 安全 保护 技术 。 

1. 全 自动 备份 技术 

全 自动 备份 技术 的 实质 是 建立 两 台 同 步 工作 的 相同 服务 器 ， 当 其 中 一 台 服 务 器 出 现 
故障 时 ， 男 一 台 服 务 器 可 以 立即 接 入 系统 并 替代 故障 的 服务 器 继续 工作 。 全 自动 备份 技 
术 极 大 地 提高 了 系统 的 可 靠 性 , 确保 了 系统 的 数据 在 损坏 或 丢失 后 能 够 快速 恢复 ; 此 外 ， 
全 自动 备份 技术 还 可 以 确保 本 地 系统 因 发 生 不 可 预料 或 抵御 的 地 域 性 灾难 (地震 、 火 灾 、 
战争 等 ) 引起 机 器 毁坏 时 ， 能 够 在 异地 快速 恢复 服务 器 数据 及 整个 系统 。 

2. 事务 跟踪 技术 

事务 跟踪 技术 是 为 了 确保 数据 的 一 致 性 ， 针 对 服务 器 数据 库 和 多 用 户 环 境 而 设计 
‘y 其 核心 的 设计 理念 是 保证 操作 的 原子 性 ， 其 工作 方式 是 : 对 指定 的 事务 (CBRE) 要 

一 次 完成 ， 要 么 什么 操作 也 不 进行 。 

3. 自动 检验 技术 

对 于 系统 而 言 ， 发 现 与 纠正 运行 过 程 中 的 错误 是 很 有 必要 的 。 一 般 来 说 ， 一 个 完善 
的 系统 离 不 开 自 动 检验 技术 的 支持 。 自 动 检验 技术 是 快速 检测 服务 器 故障 的 一 种 有 效 手 
段 。 正 确 使 用 自动 检验 技术 对 于 服务 器 的 容错 系统 设计 是 至 关 重 要 的 ， 因 为 正确 地 使 
用 自动 检验 技术 可 以 提高 服务 器 系统 对 错误 的 反应 能 力 ， 减 少 发 现 错误 所 需 的 时 间 ， 
使 错误 存在 的 时 间 缩 短 ， 所 以 能 够 有 效 地 阻止 错误 的 进一步 草 延 ， 并 对 错误 进行 及 时 
纠正 。 


第 3 章 服务 器 基础 51 


4. 内 存 纠 错 技术 

内 存 纠 错 技 术 是 一 种 服务 器 错误 检测 与 纠 错 技术 ， 该 技术 的 核心 思想 是 尽 可 能 早 地 
发 现 错误 并 纠正 。 由 于 内 存 中 的 错误 大 多 是 一 位 接 一 位 陆续 发 生 的 ， 而 一 位 的 错误 是 可 
以 纠正 的 ， 多 位 的 错误 则 无 法 纠正 ， 因 此 当 发 现 与 纠正 一 位 的 内 存 错误 时 ， 数 据 位 便 立 
刻 被 纠正 。 

5.。 热 定位 技术 | 

热 定 位 技术 是 一 种 检测 服务 器 数据 错误 的 技术 ， 该 技术 可 以 对 写 入 磁盘 的 数据 进行 
检查 与 比较 ， 从 而 确定 写 入 的 数据 是 否 正 确 。 该 技术 的 原理 是 : 进行 磁盘 写 操作 时 ， 将 
刚 写 入 磁盘 的 数据 立刻 读 出 来 ， 并 与 写 缓冲 区 (通常 位 于 内 存 中 〉 中 的 原始 数据 比较 。 
如 果 出 现 错误 ， 则 说 明 此 处 的 磁盘 区 域 已 经 损坏 ， 需 要 将 服务 器 的 磁盘 坏 区 情况 记录 在 
磁盘 中 的 “ 热 定 位 重 定 区 ”中 ， 并 将 数据 重新 写 入 已 确定 的 坏 区 以 外 的 区 域 。 

6 自动 重启 技术 

自动 重启 技术 , 是 指 服务 器 可 以 在 无 人 管理 的 情况 下 , 发 现 系统 运行 过 程 中 出 现 的 ， 
不 可 由 系统 恢复 的 错误 ， 并 重新 启动 ， 以 极 快 的 速度 恢复 系统 运行 。 

7. 网 络 监控 技术 

网 络 监控 技术 是 一 种 可 以 让 用 户 仅 使 用 一 台 普 通 的 客户 机 监测 网 络 上 所 有 使 用 的 
服务 器 ， 就 能 判断 服务 器 是 否 正 常 工 作 的 技术 。 当 服务 器 出 现 错误 时 ， 管 理 人 员 很 快 便 
会 收 到 提示 。 上 此外， 监测 端 和 服务 器 端 之 间 通 过 网 络 连接 ， 这 样 的 网 络 可 以 是 局 域 网 ， 
也 可 以 是 广域网 。 直 接 通过 网 络 对 服务 器 进行 一 系列 的 操作 ， 极 大 地 提高 了 管理 和 维护 
的 工作 效率 。 

8. 故障 在 线 修复 技术 

故障 在 线 修复 技术 包含 故障 部 件 热 插 拔 和 部 件 在 线 配 置 两 项 技术 。 可 热 插 拔 的 服务 
器 部 件 有 硬盘 、 外 设 插 卡 、 电 源 、 风 肩 等 ， 部 分 高 端 服务 器 甚至 文 持 CPU 和 内 存 的 热 插 
拔 。 热 插 拔 技术 能 在 保障 服务 器 不 停止 工作 的 前 提 下 ， 更 换 与 升级 故障 硬件， 提高 服务 
器 的 可 用 性 与 可 扩展 性 。 在 线 配置 技术 允许 服务 器 在 运行 的 过 程 中 进行 系统 配置 (通常 
是 改写 配置 文件 )， 并 使 服务 器 按照 配置 后 的 参数 工作 。 

9. 文件 分 配 表 和 目录 表 技 术 

文件 分 配 表 和 目录 表 记 录 文 件 在 磁盘 上 的 位 置 、 文 件 大 小 、 文 件 类 型 等 信息 ， 如 果 
它们 出 现 故 障 ， 磁 盘 上 的 数据 便 会 丢失 。 文 件 分 配 表 与 目录 表 技术 采用 了 镜像 郊 余 的 思 
想 ， 通 过 提供 两 份 彼此 同步 的 、 存 储 于 不 同 存储 设备 的 文件 分 配 表 和 目录 表 的 方式 备份 
文件 分 配 表 与 目录 表 ， 从 而 达到 容错 与 故障 恢复 的 目的 。 

10. VersaStor 技术 

VersaStor 技术 是 由 康 柏 公 司 开发 的 ， 该 技术 利用 网 络 存储 池 消 除了 目前 广泛 存在 于 
不 同 存储 设备 之 间 的 兼容 性 问题 ， 从 而 使 得 在 不 同 的 存储 设备 之 间 进 行 存储 和 管理 变 得 
简单 、 高 效 。 上 此外， 存储 池 的 容量 可 以 根据 不 同 服务 器 和 应 用 程序 动态 、 透 明 地 增 减 ， 
这 使 得 存储 系统 拥有 了 良好 的 可 扩展 性 ， 同 时 ， 该 技术 还 支持 不 同 服务 器 数据 的 无 颖 、 
透明 移植 ， 提 高 了 数据 的 安全 性 与 可 靠 性 。VersaStor 技术 能 为 任何 一 个 与 SAN 网 络 连 
接 的 在 线 存储 系统 获取 与 存放 存储 空间 ， 简 化 了 存储 系统 的 部 署 ， 也 为 存储 系统 的 管理 
方式 带 来 了 新 的 变革 。 
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11. Auto RAID 技术 

该 技术 是 一 项 综合 利用 不 同 RAID 优点 ， 从 而 弥补 不 同 RAID 缺陷 的 多 级 RAID 技 
术 。 在 该 项 技术 中 ， 经 常 使 用 的 数据 存储 在 具有 较 高 读 写 性 能 的 RAID-10 一 类 的 RAID 
磁盘 中 ,而 不 太 常 用 的 数据 则 存储 在 具有 较 高 存储 空间 利用 率 以 及 较 高 安全 性 的 RAID-5 
一 类 的 RAID 磁盘 中 。 在 Auto RAID RAW FP, FRASER. ACR. PST 
展 变 得 简单 、 高 效 ， 该 技术 不 再 需要 将 数据 转移 到 RAID 中 的 其 他 磁盘 上 ， 而 仅 需 要 安 
装 好 新 的 磁盘 ， 接 着 ， 系 统 能 够 自动 判断 磁盘 的 容量 ， 并 将 它 加 入 RAID 中 ， 以 供 系 统 
使 用 。 

此 外 ，Auto RAID 还 能 够 管理 由 不 同 容量 磁盘 组 成 的 RAID。 


3.7.3 ”服务 器 负载 均衡 技术 与 应 用 


随 痢 网 络 技术 的 发 展 以 及 互联 网 应 用 范围 的 不 断 扩 张 ， 网 络 服务 器 面 对 的 访问 数量 
和 不 可 预知 性 都 极 大 地 增加 。 目 前 ， 网 络 服务 器 必须 具备 快速 处 理 大 量 访问 的 能 力 ， 但 
是 ， 目 前 服务 器 的 处 理 能 力 和 IO 能 力 的 增长 速度 落后 于 对 其 要 求 的 增长 ， 因 此 这 已 经 
逐渐 成 为 服务 器 性 能 提升 的 瓶颈 ， 这 使 得 用 户 访问 数量 的 增多 导致 通信 量 超出 服务 器 所 
能 承受 的 范围 ， 服 务 器 负载 过 重 ， 甚 至 瘫痪 。 

前 面 已 经 提 到 ， 目 前 服务 器 处 理 能 力 和 IO 能 力 增长 的 速度 落后 于 网 络 访问 数量 增 
长 所 引起 的 对 服务 器 要 求 的 增长 , 那么 , 单 台 服务 器 有 限 的 性 能 显然 不 能 解决 这 个 问题 ， 
因此 ， 需 要 将 多 台 服 务 器 组 成 一 个 系统 ， 并 通过 一 定 的 软 硬 件 技 术 将 所 有 请 求 平 均 分 配 
到 所 有 服务 器 上 ， 这 样 每 台 服 务 器 的 负载 便 被 控制 在 一 个 合适 的 范围 之 内 ， 而 系统 也 拥 
有 足够 的 处 理 能 力 ， 用 户 的 访问 能 被 有 效 、 及 时 地 处 理 。 以 上 就 是 服务 器 负载 均衡 最 初 
的 基本 设计 思想 。 

在 服务 器 负载 均衡 技术 中 ， 多 人 台 服 务 器 以 对 称 的 方式 工作 ， 每 台 服 务 器 都 具有 同等 
的 地 位 ， 都 可 以 在 没有 其 余 服务 器 协助 的 情况 下 独立 运行 。 因 此 ， 通 过 一 定 的 技术 ， 可 
以 将 外 部 发 来 的 访问 请 求 任务 均匀 地 分 配 到 系统 中 的 每 一 台 服 务 器 上 ， 从 而 使 每 台 服 务 
器 都 能 独立 地 处 理 被 分 配 到 的 任务 ， 然 后 将 请 求 的 结果 反馈 给 前 端的 服务 器 ， 再 由 前 端 
的 服务 器 反馈 给 用 户 。 图 3-8 所 示 为 负载 均衡 结构 示意 图 。 





3-8 ”服务 器 负载 均衡 结构 示意 图 


1. 基于 特定 服务 器 软件 的 负载 均衡 
由 于 发 送 请 求 所 需 的 时 间 以 及 对 服务 器 造成 的 负载 比 起 执行 服务 请 求 要 小 很 多 ， 因 
此 ， 可 以 设计 一 种 负载 均衡 的 机 制 ， 类 似 于 目前 很 多 网 络 协议 都 支持 的 “ 重 定向 ”功能 。 
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例如 ，HTTP 便 支持 访问 请 求 的 重 定 同 ， 接 收 到 这 个 请 求 的 服务 器 将 自动 重 定 癌 到 请 求 
指明 的 另 一 个 URL 上 。 因 此 , 在 负载 均衡 机 制 下 ， 当 服务 器 认为 自己 负载 较 大 时 ， 它 就 
不 再 直接 处 理 持续 而 来 的 需要 处 理 的 请 求 ， 而 是 发 送 一 个 重 定向 请 求 ， 让 用 户 去 服务 器 
集群 中 的 其 他 服务 器 上 获得 所 需 的 服务 。 

2. 基于 DNS 的 负载 均衡 

上 面 提 到 的 基于 服务 器 软件 的 负载 均衡 技术 存在 个 一 个 缺陷 ， 由 于 需要 对 软件 进行 
改动 ， 因 此 负载 均衡 操作 常常 带 来 一 定 的 性 能 损失 ， 有 时 甚至 是 得 不 偿 失 的 。 因 此 ， 负 
载 均衡 最 好 能 够 在 服务 器 软件 之 外 来 完成 ， 这 样 才能 充分 利用 现 有 服务 器 软件 的 种 种 优 
势 。 最 早 的 负载 均衡 技术 是 通过 DNS 服务 中 的 多 IP 地 址 解析 来 实现 的 , 在 这 项 技术 中 ， 
DNS 服务 器 可 以 为 多 个 不 同 的 IP 地 址 配置 同一 个 域名 ， 而 解析 这 个 域名 的 DNS 服务 器 
给 予 访问 这 个 域名 的 用 户 其 中 任意 一 个 卫 地 址 。 因 此 ， 对 于 同一 个 域名 ， 不 同 的 用 户 会 
得 到 不 同 的 卫 地 址 ， 即 用 户 可 以 访问 不 同 卫 地 址 上 的 Web 服务 器 ， 从 而 达到 负载 均衡 
的 目的 。 

比 起 基于 特定 服务 器 软件 的 负载 均衡 ， 基 于 DNS 的 负载 均衡 的 优点 在 于 简单 、 易 
行 ， 并 且 服 务 器 可 以 位 于 互联 网 的 任意 位 置 上 。 然 而 它 也 存在 不 少 缺 点 ， 第 一 ， 为 了 保 
证 DNS 数据 能 够 及 时 更 新 ， 一 般 都 要 将 DNS 的 刷新 时 间 设 置 得 较 小 ， 但 是 更 小 的 刷新 
时 间 意 味 着 更 多 的 刷新 次 数 ,， 这样 会 造成 极 大 的 额外 网 络 流量 ,并且 在 更 改 DNS 数据 之 
后 也 不 能 立即 生效 ; 第 二 ， 在 DNS 负载 均衡 技术 中 ， 服 务 器 之 间 的 性 能 差异 无 从 得 知 ， 
因此 不 能 做 到 为 性 能 较 好 的 服务 器 分 配 较 多 的 请 求 ， 而 为 性 能 较 差 的 服务 器 分 配 较 少 的 
请 求 ， 从 而 使 得 服务 器 的 利用 效率 较 低 ， 此 外 也 不 能 了 解 服务 器 的 当前 状态 ， 可 能 会 
现 客户 请 求 集中 在 某 一 台 服 务 器 上 的 极端 情况 。 

3. 反 向 代理 负载 均衡 

为 了 加 快 网 页 的 访问 速度 ， 可 以 使 用 代理 服务 器 将 请 求 转发 给 内 部 的 Web 服务 器 ， 
由 内 部 的 Web 服务 器 对 请 求 进行 处 理 ， 目 前 ， 使 用 这 种 加 速 模式 可 以 极 大 地 提升 静态 网 
页 的 访问 速度 。 因 此 ， 可 以 考虑 使 用 这 种 技术 ， 将 访问 请 求 均匀 地 转发 给 多 台 内 部 Web 
服务 器 ， 使 它们 共同 完成 请 求 的 处 理 ， 从 而 达到 负载 均衡 的 目的 。 不 过 ， 这 种 代理 的 使 
用 方式 与 普通 的 代理 使 用 方式 有 所 不 同 ， 普 通 的 代理 使 用 方式 是 客户 使 用 代理 访问 多 个 
外 部 Web 服务 器 ， 而 这 种 代理 方式 是 多 个 客户 使 用 它 访问 内 部 Web 服务 器 ， 因 此 也 被 
称 为 反 癌 代理 模式 。 

虽然 反 向 代理 模式 的 实现 并 不 复杂 ， 但 是 由 于 负载 均衡 技术 对 效率 的 要 求 特别 高 ， 
此 ， 实 际 上 反 同 代理 高 效率 地 实现 具有 一 定 的 难度 。 针 对 每 一 次 的 代理 处 理 ， 代 理 服务 器 
必须 打开 对 外 和 对 内 的 两 个 连接 ， 因 此 当 连 接 请 求 的 数量 较 大 时 ,代理 服务 器 的 负载 也 就 
非常 大 了 ,， 当 连接 请 求 的 数量 增 大 到 一 定 的 程度 时 , 反 向 代理 服务 器 会 成 为 服务 的 瓶颈 。 

利用 反 疝 代理 技术 ， 可 以 将 负载 均衡 技术 和 代理 服务 器 的 高 速 缓存 技术 结合 在 一 
起 ， 从 而 实现 更 高 的 性 能 ， 并 且 由 于 外 部 客户 不 能 直接 访问 真实 的 物理 服务 器 ， 而 使 得 
系统 具有 较 好 的 安全 性 。 此 外 ， 该 项 技术 可 以 实现 较 好 的 负载 均衡 策略 ， 能 够 将 负载 非 
常平 均 地 分 配给 内 部 服务 器 ， 从 而 避免 负载 集中 到 某 个 服务 器 的 极端 情况 发 生 。 

4. AF NAT 的 负载 均衡 技术 

网 络 地 址 转换 (network address translation, NAT) 可 以 实现 内 部 地 址 和 外 部 地 址 之 
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间 的 转换 ， 使 不 具有 外 部 网 络 地 址 的 计算 机 能 够 访问 外 部 网 络 ， 而 当 外 部 网 络 中 的 计算 
机 希望 访问 NAT 连接 的 子 网 内 部 的 某 一 台 计 算 机 时 ，NAT 技术 能 够 通过 外 部 网 络 中 的 
计算 机 提供 的 外 部 地 址 ， 将 其 映射 到 一 个 唯一 的 内 部 地 址 上 ， 从 而 实现 外 部 网 络 与 内 部 
网 络 计 算 机 之 间 的 连接 。 因此， 如果 NAT 能 将 每 个 连接 均匀 地 转换 为 不 同 的 内 部 服务 器 
的 网 络 地 址 ， 外 部 网 络 中 的 计算 机 就 各 自 与 自己 转换 得 到 的 地 址 上 的 服务 器 连接 ， 从 而 
实现 负载 均衡 。 

NAT 有 多 种 实现 方式 ， 可 以 通过 软件 方式 或 者 硬件 方式 实现 。 

使 用 软件 方式 实现 基于 NAT 的 负载 均衡 更 为 简便 可 行 ， 也 是 目前 较为 常用 的 方式 。 
目前 , 除了 一 些 厂 商 提供 的 解决 方法 之 外 , 还 可 以 使 用 免费 的 自由 软件 来 完成 这 项 任务 ， 
大 大 降低 服务 器 负载 均衡 所 需 的 安装 维护 成 本 ， 如 Linux Virtual Server Project 中 的 NAT 
实现 方式 。 通 常 ， 使 用 软件 方式 实现 的 NAT， 其 中 心 负 载 均 衡器 存在 带宽 限制 。 例 如 ， 
在 100Mbit/s 的 快速 以 太 网 条 件 下 , 理论 上 能 够 达到 的 最 大 带宽 为 80Mbit/s, 然而 在 实际 
应 用 中 ， 可 能 只 能 够 提供 40~60Mbit/s 的 可 用 带宽 。 

使 用 硬件 方式 实现 的 NAT 一 般 被 称 为 交换 ，, 通常， 交换 必须 保存 TCP 连接 的 信息 ， 
而 这 种 针对 OSI 网 络 层 的 操作 被 称 为 第 四 层 交 换 。 目 前 ， 文 持 负载 均衡 的 NAT 是 第 四 
层 交换 机 的 一 种 重要 功能 ， 被 大 量 的 交换 机 厂商 实现 ， 由 于 它 基 于 定制 的 硬件 芯片 ， 因 
此 具有 极 高 的 性 能 与 工作 效率 ， 很 多 交换 机 都 具备 400~800Mbit/s 的 第 四 层 交 换 能 力 。 

5. 扩展 的 负载 均衡 技术 

扩展 的 负载 均衡 技术 的 提出 , 是 为 了 解决 上 面 提 到 的 基于 NAT 的 负载 均衡 技术 存在 
的 缺陷 。 在 基于 NAT 的 负载 均衡 技术 中 , 由 于 所 有 的 网 络 连接 都 必须 通过 中 心 负 载 均衡 
器 实现 NAT， 从 而 实现 外 部 与 内 部 网 络 的 间接 互 连 以 及 负载 均衡 ， 这 样 的 中 心 负载 均衡 
器 的 工作 负担 很 重 ， 极 易 成 为 制约 整个 系统 性 能 的 瓶颈 。 因 此 ， 解 决 这 个 问题 的 关键 在 
于 如 何 分 散 网 络 负载 。 在 扩展 的 负载 均衡 技术 中 ， 通 过 DNS 和 NAT 两 种 方法 来 实现 。 

当 客 户 发 送 请 求 给 负载 均衡 器 时 ， 在 基于 半 中 心 的 负载 均衡 方式 中 ， 中 心 负载 均衡 
器 只 将 请 求 打 包 并 发 送 给 某 个 服务 器 ， 而 不 再 接受 服务 器 的 回应 请 求 ， 服 务 器 在 处 理 完 
请 求 任 务 后 ， 不 再 将 回应 请 求 返 回 给 中 心 负载 均衡 器 ， 而 是 直接 返回 给 客户 ， 因 此 中 心 
负载 均衡 器 只 负责 请 求 的 接受 与 转发 ， 其 网 络 负担 大 大 减 小 。 

比较 上 面 提 到 的 5 种 负载 均衡 方式 ， 可 以 发 现 ，DNES 方式 最 容易 实现 ， 也 是 目前 最 
常用 的 负载 均衡 方式 , 能 够 满足 一 般 性 的 需求 。 但 是 ,如果 需 要 进一步 管理 和 控制 , DNS 
方式 在 性 能 与 效率 上 可 能 无 法 达到 要 求 ， 此 时 可 以 选择 反 回 代理 方式 或 NAT 方式 , 选择 
这 两 种 方式 中 的 哪 一 种 主要 是 依据 缓冲 是 否 重要 、 最 大 的 并 发 访问 数量 等 条 件 。 


3.7.4 服务 器 容错 技术 与 应 用 


服务 器 容错 技术 是 指 在 服务 器 硬件 或 软件 出 现 故 障 时 ， 仍 能 完成 处 理 和 运算 ， 不 降 
低 系 统 性 能 ， 即 用 宛 余 的 资源 使 计算 机 具有 容忍 故障 的 能 力 ， 这 可 通过 硬件 和 软件 方法 
来 实现 。 

1. 服务 器 容错 方法 

目前 ， 服 务 器 容错 方法 有 基于 软件 和 硬件 两 种 。 服 务 器 软件 容错 通常 采用 多 处 理 器 
或 者 特别 设计 的 具有 容错 功能 的 操作 系统 来 实现 ， 这 样 的 方法 主要 提供 以 检查 点 为 恢复 
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基础 的 恢复 机 能 。 具 体 的 实现 方法 是 ， 每 个 运行 中 的 进程 都 在 男 一 个 处 理 机 上 具有 完全 
相同 ， 但 并 不 活动 的 后 备 进程 。 当 运行 的 进程 发 生 了 不 能 恢复 的 错误 时 ， 操 作 系统 将 发 
现 这 一 错误 并 局 用 后 备 进程 蔡 换 ， 后 备 进程 从 最 后 一 个 检查 点 开始 恢复 计算 。 

随 着 硬件 搁 术 的 不 断 发 展 ， 硬 件 性 能 逐渐 提高 ， 成 本 则 不 断 下 降 ， 但 是 软件 成 本 由 
于 软件 开发 难度 的 不 断 提升 而 升 高 , 因此 , 目前 服务 器 硬件 容错 技术 的 应 用 越 来 越 普 遍 ， 
通常 ， 便 件 容错 系统 应 具有 以 下 特性 。 

C1) 使 用 双 总 线 体系 结构 ， 确 保 系 统 的 某 一 部 分 发 生 故 障 时 仍 能 运行 ， 不 降低 系统 


(2) CPU、 内 存 、 通 信子 系统 、 磁 盘 、 电 源 等 具有 宛 余 ， 确 保 这 些 关 键 部 件 的 可 
靠 性 。 

(3) 具有 上 自动 故障 检测 部 件 、 故 障 隔离 部 件 和 联机 更 换 故 障 部 件 。 

2. 服务 器 容错 技术 

目前 应 用 的 服务 器 容错 技术 主要 有 3 种 ， 分 别 是 服务 器 群集 技术 、 双 机 热 备份 技术 
和 单机 容错 技术 。 

服务 器 集群 技术 在 上 面 的 小 节 中 已 详细 介绍 ， 这 里 不 再 歼 叙 ， 仅 对 双 机 热 备份 技术 
和 单机 容错 技术 进行 介绍 。 

3. 双 机 热 备 份 技术 

双 机 热 备份 技术 是 一 种 容错 级 别 较 高 的 服务 器 容错 技术 。 该 方案 具有 专门 的 软 硬 件 
基础 ， 由 两 台 服 务 器 、 一 个 外 接 的 共享 磁盘 阵列 及 相应 的 双 机 热 备份 软件 组 成 。 

在 双 机 热 备 份 方 案 中 ， 在 两 台 服 务 器 独 有 的 本 地 磁盘 上 安装 操作 系统 与 应 用 程序 ， 
即 仅 与 服务 器 相关 的 数据 存放 在 服务 器 独 有 的 本 地 磁盘 上 ， 而 整个 系统 的 数据 是 通过 磁 
盘 阵 列 集中 管理 和 备份 的 ， 可 以 被 两 台 服 务 器 共享 。 这样， 所 有 的 系统 数据 直接 通过 一 
个 统一 的 中 央 存 储 设备 进行 读 取 和 存储 ， 并 由 专业 人 员 管 理 ， 从 而 极 大 地 提高 了 数据 的 
安全 性 和 可 靠 性 性 。 因 此 ， 在 主 服 务 器 出 现 故障 时 ， 备 用 服务 器 能 够 主动 奉 代 主 服 务 器 
工作 ， 保 证 网 络 服务 不 间断 。 

双 机 热 备份 系统 中 ， 主 服务 器 与 备用 服务 器 能 够 互相 监测 对 方 的 运行 状态 。 具 体 的 
实现 方法 是 ， 主 服务 器 与 备用 服务 器 之 间 相 互 按照 一 定 的 时 间 间 隔 发 送 通信 信号 ， 表 明 
各 目 系统 当前 的 运行 状态 。 一 旦 通信 信和 号 表明 服务 器 系统 发 生 故 障 ， 或 者 无 法 收 到 另 一 
服务 器 系统 的 通信 信号 时 (一 般 是 备用 服务 器 无 法 收 到 主 服务 器 的 通信 信号 ), 系统 的 管 
理 软 件 便 会 认为 主 服 务 器 发 生 了 故障 ， 使 主 服 务 器 停止 工作 ， 并 将 系统 资源 转移 到 备用 
系统 上 ， 备 用 系统 将 替代 服务 器 工作 ， 从 而 保证 网 络 服 务 运行 不 间断 。 

在 双 机 热 备份 方案 中 ， 根 据 两 台 服 务 器 的 工作 方式 可 以 有 3 种 工作 模式 ， 分 别 是 双 
机 热 备 模式 、 双 机 互 备 模式 和 双 机 双 工 模式 。 

4， 双 机 热 备 模式 

双 机 热 备 模式 也 叫 Active/Standby 模式 ， 其 中 Active 服务 器 处 于 工作 状态 ， 处 理 系 
统 的 访问 请 求 ，Standby 服务 器 则 处 于 监控 准备 状态 ， 数 据 同 时 间 两 台 服 务 器 写 入 ， 以 保 
证 数据 的 即时 同步 。 当 Active 服务 器 出 现 故 障 时 ， 通 过 软件 诊 测 或 手工 方式 将 Standby 
机 器 激活 ， 从 而 保证 原先 运行 在 Active 服务 器 上 的 应 用 程序 能 够 在 短 时 间 内 完全 恢复 正 
常 。 双 机 热 备 模式 的 典型 应 用 环境 是 证 券 资 金 服 务 器 或 金融 行业 服务 器 ， 这 也 是 目前 采 
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用 较 多 的 一 种 双 机 热 备 份 方案 ， 但 由 于 另外 一 台 服 务 器 长 期 处 于 后 备 状态 ， 资 源 利用 率 
并 不 高 。 

5.。 双 机 互 备 模 式 

相 比 于 双 机 热 备 模式 中 ， 一 台 服 务 器 长 期 处 于 后 备 状态 而 无 法 充分 发 挥 其 处 理 能 
力 ， 在 双 机 互 备 模式 中 ， 两 台 服 务 器 同时 运行 ， 它 们 既是 主 服 务 器 ， 同 时 也 是 另 一 台 服 
务 器 的 备用 服务 器 ， 当 某 一 台 服 务 器 出 现 故 障 时 ， 男 一 台 服 务 器 可 以 在 短 时 间 内 将 故障 
服务 器 的 应 用 接管 过 来 ， 并 替代 故障 服务 器 继续 工作 ， 从 而 保证 应 用 的 持续 性 ， 但 由 于 
服务 器 在 运行 自身 应 用 的 同时 还 需要 运行 故障 服务 器 的 应 用 ， 因 此 该 模式 对 服务 器 的 性 
能 要 求 比较 高 。 

6， 双 机 双 工 模式 

双 机 双 工 模式 是 目前 广泛 使 用 的 集群 技术 的 一 种 形式 ， 该 模式 中 的 两 台 服 务 器 均 处 
在 活动 状态 ， 不 同 于 双 机 互 备 模式 ， 在 双 机 双 工 模式 中 ， 两 台 服 务 器 同时 运行 相同 的 应 
用 ， 既 保证 了 系统 的 整体 性 能 ， 又 实现 了 负载 均衡 以 及 服务 器 的 相互 备份 。 目 前 Web fk 
务 器 或 FTP 服务 器 等 用 该 模式 比较 多 。 

7. 单机 容错 技术 

从 上 面 的 分 析 以 及 3.7.3 小 节 中 的 内 容 可 知 ， 采 用 双 机 热 备份 技术 的 系统 需要 两 台 
配置 完全 一 样 的 服务 器 ， 而 采用 服务 器 群集 技术 的 系统 需要 多 台 服 务 器 ， 那 么 ， 是 否 存 
在 一 种 服务 器 容错 技术 ， 使 得 系统 仅 需 一 台 服 务 器 便 够 了 呢 ? 

答案 是 肯定 的 ， 单 机 容错 技术 便 是 一 种 在 一 台 服 务 器 实现 高 性 能 容错 的 服务 器 容错 
技术 ， 比 起 服务 器 集群 和 双 机 热 备份 技术 ， 它 的 容错 能 力 更 高 ， 因 此 在 一 些 对 系统 容错 能 
力 要 求 极 高 的 行业 或 领域 ， 如 证 券 、 电 信 、 人 金融 等 ， 单 机 容错 技术 具有 更 为 广泛 的 应 用 。 

在 服务 器 集群 技术 和 双 机 热 备 份 技术 中 ， 当 服务 器 出 现 故障 时 ， 系 统 只 有 中 断 服务 器 
的 运行 ， 然 后 用 一 定 的 时 间 将 故障 服务 器 所 运行 的 应 用 程序 转移 到 备用 的 服务 器 上 运行 ， 
才能 维修 和 恢复 。 这 一 过 程 会 消耗 较 多 的 时 间 ， 且 系统 无 法 继续 提供 服务 ， 因 此 其 所 付出 
的 成 本 以 及 带 来 的 损失 是 用 户 不 愿 看 到 的 。 而 采用 单机 容错 技术 的 系统 配备 了 具有 容错 技 
术 的 容错 服务 器 ， 系 统 能 够 自动 分 离 故 障 模块 ， 在 不 中 断 运 行 的 情况 下 ， 替 换 模块 ， 再 
对 损坏 的 部 件 进 行 维护 ， 从 而 有 效 地 解决 了 服务 器 集群 技术 和 双 机 热 备 份 技术 的 缺陷 。 

容错 服务 器 的 容错 技术 是 通过 CPU 时 钟 锁 频 实 现 的 。 该 技术 会 对 系统 中 所 有 的 硬件 
进行 元 余 备 份 ， 尤 其 是 处 理 器 、 内 存 以 及 总 线 等 服务 器 的 关键 部 件 ， 此 外 ， 还 会 对 系统 
内 的 所 有 宛 余 部 件 进行 同步 ， 从 而 实现 真正 意义 上 的 容错 ， 系 统 任何 部 件 的 故障 都 不 会 
造成 系统 停顿 和 数据 丢失 ， 以 达到 快速 恢复 的 目的 。 

双 机 热 备 份 技术 与 单机 容错 技术 在 适用 环境 上 的 不 同 主要 是 由 两 者 能 够 实现 的 可 
用 性 的 差异 决定 的 。 一 般 ， 双 机 热 备 份 可 以 实现 99.9% 的 可 用 性 ， 而 容错 服务 器 可 以 实 
现 的 可 用 性 高 达 99.999%。 因 此 ， 从 可 用 性 数据 上 来 看 ， 双 机 热 备 份 技术 大 多 适用 于 对 
于 业务 连续 性 要 求 不 是 很 严格 的 环境 中 ， 如 政府 、 教 育 以 及 个 别 的 制造 企业 ， 因 为 这 些 
行业 的 应 用 通 和 允许 数据 或 者 服务 有 一 小 段 时 间 的 中 断 。 但 是 在 电信 、 人 金融、 证 券 和 医 
疗 等 对 业务 的 可 连续 性 要 求 极 高 的 行业 中 ， 单 机 容错 技术 得 到 了 更 为 广泛 的 应 用 。 

此 外 ， 由 于 采用 双 机 热 备份 技术 的 系统 需要 两 台 服 务 器 ， 因 此 在 软件 付费 授权 、 软 
件 维护 升级 、 系 统 硬件 升级 等 方面 都 需要 投入 比 采 用 单机 容错 技术 的 系统 多 出 一 倍 的 额 
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外 成 本 ， 系 统 安装 与 维护 的 成 本 较 高 。 由 于 双 机 备份 软件 也 会 出 现 故 障 ， 且 其 出 现 故 障 
后 ， 系 统 失去 容错 能 力 ， 给 用 户 带 来 较 大 影响 。 因 此 虽然 单机 容错 技术 的 硬件 成 本 高 于 
双 机 备份 方式 的 硬件 投入 ， 但 其 总 成 本 却 等 于 甚至 小 于 双 机 热 备 份 技术 的 成 本 。 

但 是 ， 在 系统 配置 灵活 性 方面 ， 双 机 热 备份 技术 由 于 可 以 对 不 同 厂商 的 服务 器 产品 
进行 组 合 ， 从 而 更 具 优 势 ， 以 满足 不 同 应 用 的 需求 。 


3.7.5 “服务 器 虚拟 技术 与 应 用 


随 着 网 络 技术 的 不 断 发 展 以 及 网 络 服务 的 日 益 多 样 化 ， 对 服务 器 的 要 求 也 日 益 提 
高 。 单 个 服务 器 性 能 的 缓慢 增长 已 经 成 为 网 络 服务 发 展 的 瓶颈 ， 因 此 ， 服 务 器 虚拟 技术 
被 提出 并 迅速 得 到 了 广泛 的 应 用 。 服 务 器 虚拟 化 是 一 种 方法 ， 它 能 够 区 分 资源 的 优先 次 
序 ， 并 将 服务 器 资源 合理 分 配给 不 同 的 工作 任务 ， 从 而 简化 管理 ， 提 高 效率 ， 使 得 为 单 
个 工作 负载 峰值 而 储备 的 资源 减少 ， 提 高 了 系统 资源 的 利用 率 。 

1. 服务 器 虚拟 化 概述 

服务 器 虚拟 化 将 适用 于 70% 的 工作 负载 。 现在 只 有 12% 的 x86 服务 器 工作 负载 是 在 
虚拟 机 上 运行 的 。 在 2008 年 配置 或 者 重新 配置 的 x86 服务 器 工作 负载 中 ,有 四 分 之 一 是 
安装 在 虚拟 机 上 的 。 现 在 有 70% 的 虚拟 机 被 用 于 运营 环节 ， 而 就 在 几 年 前 ， 大 多 数 虚拟 
机 还 只 是 用 于 测试 和 配置 环节 。 桌 面 虚拟 化 技术 也 开始 迅速 发 展 ,虚拟 PC 的 数量 从 2007 
年 不 足 500 万 台 增 长 到 如 今 10 亿 台 规模 。 

服务 器 虚拟 化 的 主要 功能 是 集中 工作 量 ， 以 提高 资源 的 有 效 利用 率 。 它 可 以 减少 运 
营 费 用 ( 包 插 硬件、 能 源 与 空间 费用 等 )， 增 加 正常 运行 时 间 与 可 用 性 ,增强 灾难 备份 功 
能 ， 减 少 维 护 带 来 的 干扰 ， 人 简化 资源 配置 与 扩展 流程 。 

有 了 虚拟 化 技术 ， 用 户 可 以 动态 启用 虚拟 服务 器 〈 又 叫 虚 拟 机 )， 每 个 服务 器 实际 上 可 
以 让 操作 系统 〈 以 及 在 上 面 运 行 的 任何 应 用 程序 ) 认为 虚拟 机 就 是 实际 硬件 服务 器 。 运 行 多 
个 虚拟 机 还 可 以 充分 发 挥 物理 服务 器 的 计算 潜能 ， 迅 速 应 对 数据 中 心 不 断 变化 的 需求 。 

2. 服务 器 虚拟 化 技术 的 选择 

目前 ， 主 要 有 3 种 服务 器 虚拟 化 技术 ， 分 别 是 硬件 虚拟 化 、 并 行 虚拟 化 和 操作 系统 
虚拟 化 。 

C1) 硬件 虚拟 化 

硬件 虚拟 化 是 目前 最 为 常见 的 服务 器 虚拟 化 技术 ， 该 技术 的 核心 在 于 对 硬件 资源 进 
行 虚拟 化 ， 从 而 获得 可 以 单独 工作 与 管理 的 “虚拟 机 ” 目前 ， 硬 件 虚拟 化 技术 的 主要 产 
品 有 VMware 和 Microsoft 的 Virtual Server。 

(2) 并 行 虚拟 化 

并 行 虚拟 化 也 可 以 在 一 台 服 务 器 上 实现 多 种 操作 系统 ， 这 一 点 与 便 件 虚拟 化 类 似 ， 
不 过 与 硬件 虚拟 化 相 比 , 并 行 虚拟 化 能 够 对 操作 系统 进行 修改 ,以 降低 额外 的 资源 损耗 ， 
从 而 提高 服务 器 的 工作 效率 与 资源 利用 率 。 目 前 ， 只 有 Xen 的 开源 项 目 实现 了 并 行 虚拟 
化 技术 。 

(3) 操作 系统 虚拟 化 

操作 系统 虚拟 化 的 概念 是 基于 操作 系统 的 ， 由 于 不 包含 额外 的 处 理 层 ， 所 以 它 提供 
了 一 个 更 加 微小 的 体系 架构 ， 这 样 可 以 使 虚拟 化 需要 消耗 的 资源 更 少 ， 也 提高 了 效率 。 
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但 是 ， 这 项 技术 并 不 支持 在 一 台 物 理 服 务 器 实现 多 种 操作 系统 。 因 此 不 适合 在 单 台 物理 
服务 器 上 集成 或 部 车 多 种 不 同 操作 系统 的 虚拟 服务 器 。 


3.8 ”服务 器 操作 系统 


3.8.1 操作 系统 概述 


服务 器 操作 系统 (server operating system, SOS) 实际 上 是 一 组 应 用 程序 。 它 提供 了 
服务 器 网 络 环境 下 用 户 与 网 络 资源 之 间 的 接口 ， 并 实现 对 网 络 的 管理 和 控制 。 
服务 器 操作 系统 的 基本 功能 有 : 设备 共享 、 多 用 户 文件 管理 、 名 字 服 务 、 网 络 安全 、 
容错 及 多 协议 支持 、 用 户 界 面 、 网 络 互 连 及 应 用 软件 支持 ， 等 等 。 


3.8.2 ”常见 的 操作 系统 


目前 服务 器 主要 使 用 以 下 几 类 网 络 操作 系统 。 

1. Windows 类 

Windows 系列 操作 系统 是 由 全 球 最 大 的 软件 开发 商 Microsoft (WK) 公司 开发 
的 。 微软 公司 的 Windows 系统 不 仅 在 个 人 操作 系统 中 占有 绝对 优势 ， 在 服务 器 操作 系统 
中 也 占据 了 巨大 的 市 场 份额 。 

微软 的 网 络 操作 系统 主要 有 : Windows NT Serve. Windows 2000 Server. Windows 
Server 2003， 以 及 最 新 的 Windows Server 2012 等 。 

2. NetWare 类 

NetWare 操作 系统 由 于 对 硬件 条 件 的 要 求 较 低 而 受到 一 些 设备 比较 落后 的 用 户 青 
睐 。 此 外 ， 由 于 兼容 DOS 命令 ， 应 用 环境 与 DOS 相似 ，NetWare 在 经 历 了 长 时 间 的 发 
展 以 后 ， 已 经 具备 了 极为 丰富 的 应 用 软件 支持 ， 且 技术 完善 。 目 前 ，NetWare 的 常用 版 
本 有 3.11、3.12、4.10、V4.11、V5.0 等 ， 常 用 于 教学 网 和 网 吧 环 境 。 不 过 目前 NetWare 
的 市 场 占 有 率 呈 下 降 趋 势 ， 其 占有 的 市 场 逐渐 被 Windows 和 Linux 抢占 。 

3. UNIX 类 

UNIX 网 络 操作 系统 历史 悠久 ， 其 良好 的 网 络 管理 功能 已 为 广大 网 络 用 户 所 接受 
支持 丰富 的 应 用 软件 。UNIX 本 是 针对 小 型 机 服务 器 环境 开发 的 操作 系统 ， 是 一 种 集中 
式 分 时 多 用 户 体 系 结构 。 

目前 服务 器 常用 的 UNIX 系统 主要 有 IBM 的 AIX, HP-UX, SUN 的 Solaris, SCO 
的 UNIX 及 UNIX SUR 等 UNIX 系统 最 早 由 AT&T 和 SCO 公司 推出 , 支持 网 络 文件 系 
统 服务 ， 提 供 数 据 等 应 用 ， 功 能 强大 。 这 种 网 络 操作 系统 稳定 性 和 安全 性 非常 好 ， 但 由 于 
它 多 数 是 以 命令 方式 来 进行 操作 的 ， 不 容易 掌握 ,特别 是 初级 用 户 。 因 此 ， 小 型 局 域 网 基 
本 不 使 用 UNIX 作为 网 络 操作 系统 ，UNIX 一 般 用 于 大 型 的 网 站 或 大 型 的 企 事业 网 络 中 。 

4. Linux 类 

这 是 一 种 新 型 的 网 络 操作 系统 ， 它 最 大 的 特点 就 是 源 代 码 开 放 ， 可 以 免费 得 到 许多 
应 用 程序 ， 并 且 在 安全 性 和 稳定 性 方面 与 UNIX 有 许多 类 似 之 处 。 目 前 也 有 中 文 版 本 的 
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Linux， 如 REDHAT ( 红 帽 )、SuSE Linux、 红 旗 Linux 等 。 

总 地 来 说 ， 系 统 对 特定 计算 环境 的 支持 ， 使 得 每 一 个 操作 系统 都 有 适合 于 自己 的 工 
作 场 合 。 例 如 ，Linux 目前 较 适 用 于 小 型 的 网 络 ， 而 Windows Server 2012 和 UNIX 则 适 
用 于 大 型 服务 器 应 用 程序 。 因 此 ， 对 于 不 同 的 网 络 服务 器 应 用 ， 需 要 有 目的 、 有 针对 性 
地 选择 合适 的 网 络 操作 系统 。. 


3.9 服务 器 文件 系统 


3.9.1 文件 系统 概述 


文件 系统 为 用 户 访问 底层 数据 提供 服务 。 文 件 系统 将 存储 设备 〈 一 般 是 磁盘 ) 分 为 者 
干 大 小 相同 的 区 域 ， 称 之 为 块 ， 数 据 以 块 为 单位 存储 在 存储 设备 中 。 文 件 系统 负责 将 这 些 
块 分 配给 各 个 文件 与 目录 , 并 记录 哪些 块 被 分 配给 了 哪个 文件 或 目录 , 哪些 块 还 未 被 分 配 。 


3.9.2 ”常见 的 文件 系统 


服务 器 中 常见 的 文件 系统 主要 有 以 下 几 种 。 

1， 磁 盘 文 件 系统 

磁盘 文件 系统 是 一 种 利用 数据 存储 设备 存储 文件 的 文件 系统 ， 目 前 最 为 常见 的 数据 
存储 设备 是 磁盘 ， 磁 盘 可 以 直接 或 者 间接 地 与 计算 机 连接 。 常 用 的 文件 系统 有 很 多 ， 
MS-DOS 和 Windows 3.x 使 用 FAT16 文件 系统 , 默认 情况 下 , Windows 98 也 使 用 FAT16， 
Windows 98 和 Windows Me 可 以 同时 支持 FAT16、FAT32 两 种 文件 系统 ，Windows NT 
支持 FAT16, NTFS 两 种 文件 系统 ，Windows 2000 可 以 支持 FAT16, FAT32, NTFS 三 种 
文件 系统 ，Linux 可 以 支持 多 种 文件 系统 ， 如 FAT16、FAT32、NTFS、Minix、ext、ext2、 
ext3、ext4、xiafs、HPFS、VFAT 等 ， 不 过 Linux 一 般 都 使 用 ext2 文件 系统 。 

2. 数据 库 文 件 系统 

不 同 于 磁盘 文件 系统 将 存储 介质 划分 为 一 个 个 的 块 ， 再 将 文件 存放 在 大 干 块 上 ， 并 
在 逻辑 上 为 文件 建立 分 层 的 目录 结构 ， 数 据 库 文件 系统 是 一 种 基于 数据 库 的 文件 系统 。 
它 不 使 用 分 层 结 构 进行 管理 ， 而 是 将 文件 按照 特征 ， 如 文件 类 型 、 作 者 这 样 一 些 文件 的 
亚 数 据 ， 进 行 区 分 。 因 此 数据 库 文件 系统 所 管理 的 文件 可 以 使 用 SQL 检索 。 

WinFS 是 一 种 典型 的 数据 库 文件 系统 。 事 实 上 ，WinFS 服务 可 以 看 作 是 在 NTFS 的 
基础 上 增加 了 一 个 数据 库 层 ， 这 个 数据 库 层 以 SQL Server 的 “Yukon” 版 为 基础 。 对 于 
WinFS 来 说 ， 文 件 除 了 我 们 熟悉 的 属性 ， 诸 如 文件 名 称 、 大 小 、 日 期 外 ， 还 将 通过 作者 
名 、 图 像 大 小 之 类 的 元 数据 建立 索引 。 系 统 底层 的 目录 结构 仍 将 存在 ， 但 用 户 使 用 的 将 
是 一 个 由 相似 文件 构成 的 库 (library)。 每 个 库 由 一 组 通过 查询 WinFS 数据 库 获 得 的 文件 
构成 。 

3. 网 络 文件 系统 

网 络 文件 系统 (network file system, NFS) 是 一 种 将 远程 主机 上 的 分 区 (目录 ) 经 
网 络 挂 载 到 本 地 系统 的 一 种 机 制 。NFS 由 SUN 公司 研制 的 UNIX 表示 层 协 议 
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(pressentation layer protocol)， 能 使 用 户 访问 网 络 上 的 文件 就 像 访问 本 地 文件 一 样 。 NES 
是 基于 UDP/P 协议 的 应 用 , 其 实现 主要 是 采用 远程 过 程 调用 RPC 机 制 , RPC 提供 了 一 组 
与 机 器 、 操 作 系 统 以 及 低层 传送 协议 无 关 的 存 取 远 程 文件 的 操作 。RPC 基于 XDR 协议 ， 
XDR 是 一 种 与 机 器 无 关 的 数据 描述 编码 的 协议 ， 它 以 独立 于 任意 机 器 体系 结构 的 格式 对 
网 上 传送 的 数据 进行 编码 和 解码 ， 支 持 在 异 构 系 统 之 间 传 送 数据 。 其 具有 以 下 3 个 特点 。 

C1) 提供 透明 文件 访问 以 及 文件 传输 。 

(2) 容易 扩充 新 的 资源 或 软件 ， 不 需要 改变 现 有 的 工作 环境 。 

(3) 高 性 能 ， 可 灵活 配置 。 


3.10 ”服务 器 高 可 用 集群 技术 与 应 用 


3.10.1 集群 技术 概述 


集群 (cluster) 是 出 于 提高 可 靠 性 、 可 用 性 、 适 用 性 或 者 提高 性 能 (通过 平衡 分 配 
ABO 的 目的 ， 而 连接 到 一 起 的 计算 机 的 集合 。 通 常 ， 集 群 中 的 计算 机 能 够 访问 茶 个 公 
共 的 存储 池 ， 并 且 都 运行 某 种 特定 的 软件 ， 以 协调 各 个 计算 机 的 运行 。 采 用 集群 系统 通 
常 是 为 了 提高 服务 器 系统 的 稳定 性 和 网 络 中 心 的 数据 处 理 能 力 及 服务 能 力 。 

一 个 集群 包含 了 多 人 台 拥 有 共享 数据 存储 空间 的 服务 器 。 当 一 个 应 用 运行 于 其 中 的 一 
台 服 务 器 时 ， 应 用 数据 存储 于 服务 器 共享 的 存储 空间 内 。 而 每 台 服 务 器 的 操作 系统 与 应 用 
程序 存储 在 其 独占 的 本 地 储存 空间 中 。 通过 一 个 内 部 局 域 网 ， 集 群 内 的 各 个 节点 服务 器 可 
以 相互 通信 。 当 一 台 节 点 服务 器 发 生 故障 时 ， 这 人 台 服 务 器 上 运行 的 应 用 程序 可 以 被 另 一 节 
点 服务 器 目 动 接管 ， 从 而 继续 运行 。 当 一 个 应 用 服务 发 生 故 障 时 ， 该 应 用 将 重新 运行 ， 或 
者 被 男 一 台 服 务 器 接管 。 因 此 , 当 以 上 故障 发 生 时 , 用 户 能 够 快速 连接 到 新 的 应 用 服务 上 。 

在 集群 中 ， 集 群 软件 是 必须 的 ， 它 提供 错误 侦 测 与 恢复 功能 ， 并 在 逻辑 上 将 多 台 服 
务 器 抽象 为 一 台 服 务 器 ， 因 此 ， 集 群 中 的 每 一 人 台 节 点 服务 器 都 必须 运行 集群 软件 。 在 工 
作 中 ， 集 群 内 的 每 个 节点 必须 知道 其 余 节点 的 状态 ， 为 了 保证 节点 间 清 晰 通信 ， 目 前 使 
用 专 一 的 网 络 接口 卡 来 实现 节点 间 的 连接 与 通信 。 该 线路 传播 正常 工作 节 氮 间 的 信号， 
只 要 一 个 节点 故障 ， 信 和 号 就 会 消失 ， 此 时 错误 接管 进程 开始 运行 。 


3.10.2 ”常见 的 集群 技术 


1. 服务器 镜像 技术 

通过 软件 或 者 其 他 特殊 的 网 络 设备 ， 如 镜像 卡 ， 可 以 使 同一 局 域 网 内 的 两 台 服 务 器 
形成 镜像 ， 这 称 为 服务 器 镜像 技术 。 在 两 台 服 务 器 中 ， 一 台 是 主 服务 器 ， 另 一 台 是 从 服 
务 器 。 用 户 只 能 对 主 服务 器 进行 操作 ， 如 将 数据 写 入 主 服务 器 的 磁盘 ， 因 此 ， 只 有 主 服 
务 器 通过 网 络 向 用 户 直接 提供 服务 ， 而 从 服务 器 上 相应 的 卷 被 锁定 以 防 存 取 数 据 。 两 台 
服务 器 均 通 过 心跳 监测 线路 互相 监测 对 方 的 运行 状态 ， 当 主 服务 器 故障 时 ， 从 服务 器 将 
在 很 短 的 时 间 内 替代 主 服务 器 继续 工作 。 

服务 器 镜像 技术 的 特点 在 于 成 本 低廉 ， 实 现 较为 简单 ， 具 有 较 高 的 可 用 性 ， 保 证 在 
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一 台 服 务 器 故障 的 情况 下 系统 仍然 可 用 ， 但 是 这 种 技术 仅 能 使 两 全 服务 器 形成 镜像 ， 系 
统 的 可 扩展 性 较 差 ， 从 而 限制 了 这 项 技术 的 应 用 范围 。 

2. 应 用 程序 错误 接管 集群 技术 

通过 集群 技术 ， 同 一 网 络 中 的 多 台 服 务 器 可 以 连接 起 来 ， 使 集群 中 的 每 台 服 务 器 能 
够 各 自 运行 不 同 的 应 用 。 每 台 服 务 器 都 具有 单独 的 广播 地 址 ,并 对 前 端的 用 户 提供 服务 ， 
同时 ， 每 台 服 务 器 又 能 够 监测 其 余 服务 器 的 运行 状态 ， 当 茶 台 服务 器 故障 时 ， 集 群 系统 
中 对 应 的 服务 器 能 够 在 很 短 的 时 间 内 替代 其 继续 为 前 端 用 户 提供 服务 ， 这 被 称 为 应 用 程 
序 错误 接管 集群 技术 。 

通常 ， 应 用 程序 错误 接管 集群 技术 要 求 服务 器 具有 共享 的 磁盘 阵列 ， 多 人 台 服 务 器 通 
过 SCSI 电费 或 光纤 与 磁盘 阵列 相连 。 不 同 于 几 台 服务 器 同时 为 一 台 服 务 器 备份 ， 这 种 
集群 系统 中 通常 是 两 个 节点 互 为 备份 ， 它 们 通过 串口 、 共 享 磁盘 分 区 或 内 部 网 络 来 互相 
监测 对 方 的 运行 状况 。 

目前 ， 应 用 程序 错误 接管 集群 技术 大 多 用 于 数据 库 、 邮 件 等 应 用 服务 器 的 集群 中 。 而 
部 分 集群 软件 已 经 可 以 实现 上 百 台 服务 器 的 集群 ， 提 高 了 服务 器 系统 的 可 用 性 与 可 扩展 性 。 

3. 容错 集群 技术 

容错 集群 技术 可 以 将 集群 抽象 为 一 个 独立 的 系统 ， 集 群 中 的 每 个 节点 都 是 该 系统 的 
一 部 分 。 在 容错 集群 系统 中 ， 每 个 节点 都 与 其 余 节 点 紧密 地 联系 在 一 起 ， 它 们 拥有 共享 
的 内 存 、 磁 盘 以 及 CPU 等 重要 的 部 件 。 在 容错 集群 系统 中 ， 各 种 应 用 可 以 在 不 同 节点 之 
间 以 几乎 可 以 忽略 的 时 间 切 换 。 

目前 ， 容 错 集群 技术 的 缺点 在 于 成 本 很 高 ， 由 于 其 实现 需要 特殊 的 软 硬 件 设 计 ， 但 
是 ， 容 错 系统 极 大 地 提高 了 系统 的 可 用 性 与 可 靠 性 ， 故 障 恢复 能 力 极 强 ， 是 财政 、 金 融 
和 安全 部 门 的 最 佳 选择 ， 这 是 容错 集群 技术 独 有 的 优势 。 

4. 基于 软件 的 集群 技术 

(1) Windows 平台 的 集群 软件 

Microsoft 的 MSCS， 也 有 许多 第 三 方 的 专业 软件 公司 开发 的 集群 软件 ， 如 豪 威 的 
DATAWARE、VINCA 公司 的 STANDBY SERVER、NSI 公司 的 DOUBLE-TAKE。 

(2) Linux 下 的 主要 集群 软件 

Linux 下 的 集群 软件 主要 有 Red Hat Cluster Suite (简称 RHCS). Novell Cluster 
Service. Turbo Linux Cluster HA, Symantec VCS 等 。 

(3) UNIX 下 的 主要 集群 软件 

UNIX 下 的 集群 软件 主要 有 HP 的 MC/SG、IBM HACMP、Symantec 的 VCS、SCO 
的 GDS。 


3.11 华为 服务 器 产品 介绍 


3.11.1 RH2285 V2 
Tecal RH2285 V2 服务 器 (以 下 简称 RH2285 V2) 是 华为 公司 针对 互联 网 、IDC 
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(integrated data center)、 云 计算 、 企 业 市 场 以 及 电信 业务 应 用 等 需求 推出 的 具有 广泛 用 
途 的 2U 双 路 服务 器 。 

RH2285 V2 iG AFA. WA ASE. BOMB. Web 搜索 以 及 企业 基础 
应 用 和 电信 业务 应 用 ， 具 有 高 性 能 计算 、 大 容量 存储 、 低 能 耗 、 扩 展 能 力 强 、 高 可 靠 、 
易 管 理 、 易 部 署 等 优点 。 

RH2285 V2 有 以 下 3 种 规格 , 这 3 种 规格 的 主要 
差异 在 硬盘 配置 方面 。 

(1) RH2285 V2-8S。 支持 8 个 2.5 英寸 SAS/SATA/ 
SSD 和 硬盘， 外观 如 图 3-9 Pras. 

(2) RH2285 V2-12L. HF 12 个 3.5 英寸 SAS/ 
SATA 硬盘 和 2 个 2.5 英寸 SAS/SATA 硬盘 ， 外 观 如 
图 3-10 所 示 。 3-9 RH2285 V2-8S 

(3) RH2285 V2-24S。 支 持 24 个 2.5 英寸 SAS/SATA/SSD 硬盘 和 2 个 2.5 英寸 
SAS/SATA 硬盘 ， 外 观 如 图 3-11 所 示 。 








3-10 RH2285 V2-12L 3-11 RH2285 V2-24S 


3.11.2 RH5885 V2 


Tecal RH5885 V28 路 服务 器 〈 以 下 简称 RH5885 
V2) 是 华为 公司 针对 IDC、 云 计算 、 企 业 市 场 以 及 电信 
业务 应 用 等 需求 推出 的 高 性 能 计算 服务 器 产品 , 适用 于 
高 性 能 计算 、 数 据 库 、Web 服务 器 、 虚 拟 化 以 及 企业 基 
础 应 用 和 电信 业务 应 用 。 

RH5885 V2 外 观 如 图 3-12 所 示 ， 一 台 RH5885 V2 
包括 两 个 节点 ， 分 别 是 主 节 点 和 从 节点 ， 两 个 节点 作为 





3-12 RH5885 V2 服务 器 一 台 服 务 器 运行 。 
3.11.3 E6000 
E6000 的 系统 组 件 如 图 3-13 Aras, AH: 
@ 1 个 机 箱 。 


。 10 个 服务 器 刀片 。 
e 2 个 MM (management module) 模块 。 
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。 6 个 电源 模块 。 
e 6 个 交换 模块 。 
e OS aR. 
e 1 个 DM (data module) 模块 。 
3-13 E6000 系统 组 成 
3.11.4 X6000 
L. 简介 


下 面 介 绍 X6000 的 基本 特性 和 外 观 形态 。 

Tecal X6000 服务 器 (以 下 简称 X6000) 提供 高 性 能 计算 能 力 ， 具 有 高 可 靠 性 和 模块 
化 设计 的 特点 ， 高 度 为 2U (88.90mm)， 能 够 安 AA 
Be TE PR HE 19 英寸 机 柜 中 。X6000 的 外 观 如 SR 
3-14 所 示 。 

2. 功能 特性 

X6000 共用 基础 部 件 ， 提 供 高 性 能 数据 计 
算 、 高 速 数据 传输 的 功能 以 及 灵活 IO 扩展 、 易 
维护 和 易 管理 等 特点 。 

(1) X6000 服务 器 共用 机 箱 、 供 电 和 散热 
等 基础 部 件 。 图 3-14 X6000 示意 图 

。 提供 4 个 节点 服务 器 槽 位 ， 可 以 部 署 1 一 4 个 节点 服务 器 ， 实 现 集中 管理 。 

。 配置 2 个 750W 交流 输入 的 AC/DC 电源 模块 ， 每 个 电源 模块 通过 背 板 集中 对 整 

个 机 箱 提 供 DC 电源 。 
。 JIO 框 配置 3 个 风扇 模块 为 机 箱 设备 集中 散热 ， 支 持 2+1 TTR. 
(2) 节点 服务 器 支持 高 性 能 数据 计算 和 高 速 数据 传输 。 





64 信息 存储 与 IT 管理 


e 节点 服务 器 支持 Intel Xeon 处 理 器 。 
。 节点 服务 器 上 集成 一 个 以 太 网 控制 器 ， 提 供 2 个 GE 网 口 ， 通 过 LO 框 外 出 。 
(3) X6000 服务 器 系统 实现 容易 维护 的 设计 架构 。 
© 节点 服务 器 和 电源 模块 支持 热 插 拔 操作 ， 具 有 防 误 插 特点 。 
。 电源 线 、 业 务 网 线 以 及 管理 网 线 统一 从 机 箱 后 面 外 出 ， 方 便 集中 维护 。 
(4) X6000 服务 器 系统 实现 开放 、 标 准 、 远 程 管理 功能 。 
。 遵从 智能 平台 管理 接口 (intelligent platform management interface，IPMI) 2.0 标 
准 。 
。 两 条 智能 平台 管理 总 线 (intelligent 
platform management bus, IPMB) 
实现 主 备 见 余 功 能 。 
。 可 以 在 本 地 或 通过 网 络 远 程 使 
用 IPMI 命令 配置 和 维护 服务 器 
系统 。 
e 通过 Web 界面 ,实现 KVM Over IP 
和 虚拟 媒体 等 远程 控制 功能 。 

3. 系统 组 成 

X6000 系统 组 件 最 多 包括 4 个 节操 服 
务 器 、2 个 电源 模块 、1 个 背 板 、 一 个 IO 
HE (包括 3 个 风扇 模块 )。X6000 系统 组 件 
如 图 3-15 所 示 。 


3.11.5 E9000 





3-15 X6000 系统 组 成 


1 FRR 

E9000 定位 为 高 端 计 算 平 台 。E9%000 是 面向 弹性 计算 、 电 信 计 算 的 高 性 能 企业 级 高 
端 服务 器 ， 能 够 实现 计算 、 存 储 、 网 络 的 融合 ， 文 撑 运 营 商 、 企 业 高 端 核心 应 用 。 在 硬 
件 计算 平台 的 RAS (reliability、availability、serviceability， 可 靠 性 、 可 用 性 、 可 服务 性 )、 
计算 密度 、 节 能 减 排 、 背 板 带宽 、 智 能 管控 与 服务 、 计 算 与 存储 的 弹性 配置 和 灵活 扩展 、 
网 络 低 时 延 和 加 速 方面 具有 领先 的 竞争 力 。 

提供 与 小 型 机 相当 的 品质 和 服务 能 力 ， 为 电信 运营 商 、 企 业 软 件 业务 提供 持续 的 竞 
争 力 提升 。 

在 运营 商 的 通用 业务 、 互 联网 业务 ， 提 供与 业界 通用 低 成 本 服务 器 相同 的 竞争 力 。 

为 计算 与 数据 /媒体 融合 的 业务 提供 高 带宽 、 低 延 时 的 交换 能 力 ， 文 持 计算 与 媒体 的 
融合 。 
E9000 作为 满足 任意 工作 负载 需求 的 支持 计算 、 存 储 、 网 络 融合 的 模块 化 基础 设施 ， 
其 典型 应 用 场景 如 下 。 

云 计 算 : E9000 提供 高 性 能 CPU 和 超大 容量 内 存 计算 节点 ， 适 用 于 虚拟 机 灵活 部 署 ， 
更 内 置 大 容量 低 功 耗 存 储 节 点 ， 能 提供 高 吞吐 的 共享 存储 ， 满 足 弹性 计算 应 用 的 要 求 。 

传统 IT 应 用 : 在 E9000 提供 的 计算 节点 上 创建 多 个 虚拟 机 ， 在 虚拟 机 上 部 署 Web 
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服务 器 、 应 用 服务 器 (中 间 件 〉 和 数据 库 等 服务 进程 ， 并 外 接 存 储 设 备 ， 可 实现 OA 
(办 公 自 动 化 )、ERP (企业 资源 规划 )、BI (business intelligence， 商 业 智 能 ) 等 传统 IT 
应 用 。 

Hadoop 应 用 : Hadoop 是 由 Apache 基金 会 所 开发 的 分 布 式 系统 架构 。 它 实现 了 一 个 
分 布 式 文件 系统 ， 能 够 以 高 吞吐 量 访问 应 用 程序 所 需 的 数据 ， 是 目前 较为 成 熟 、 功 能 强 
大 的 分 布 式 计 算 平 台 。 它 可 以 作为 大 数据 的 分 析 处 理 核心 引擎 。 在 第 13 章 和 第 14 章 中 ， 
会 详细 介绍 Hadoop 的 应 用 场景 、 基 本 工作 流程 。E9000 提供 计算 存储 合 一 的 计算 节点 ， 
配合 超 高 带宽 的 交换 模块 ， 为 大 数据 以 及 高 性 能 计算 提供 一 个 极 佳 的 平台 。 

高 性 能 计算 : E9000 可 应 用 于 高 性 能 计算 ， 提 供 高 性 能 、 低 延 时 的 InfiniBand 交换 。 

2. ,系统 概述 

E9000 的 系统 架构 从 有 逻辑 上 可 分 为 计算 系统 、 交 换 系统 和 管理 & 机 电 系 统 。 

计算 系统 、 交 换 系 统 以 及 管理 & 机 电 系 统 之 间 既 相互 独立 又 相互 依存 ， 实 现 统一 
的 交换 架构 ， 并 由 管理 && 机 电 系 统 提供 统一 的 设备 管理 界面 。 系统 逻 辑 架 构 如 图 3-16 
所 示 。 


管理 & 机 电 系统 
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图 3-16 ”系统 逻辑 架构 


计算 系统 包含 各 个 计算 节点 和 存储 节点 ， 通 过 交换 系统 的 VO 模块 提供 外 部 数据 接 
口 ， 并 通过 计算 系统 内 部 的 iMana 实现 机 框 级 以 及 更 高 层级 的 设备 管理 。 

交换 系统 包含 核心 交换 和 扩展 交换 , 完成 机 箱 内 计算 子 系统 之 间 的 交换 , 并 通过 IO 
模块 提供 外 部 数据 接口 。 交 换 系 统 和 管理 & 机 电 系 统 相 通 ， 通 过 配置 可 组 成 业务 交换 和 
业务 管理 交换 合 一 的 物理 网 络 或 者 相互 隔离 的 物理 网 络 。 

管理 & 机 电 系 统 由 风扇 、 电 源 、 管 理 模块 组 成 ， 实 现 对 机 箱 各 部 件 的 管理 和 系统 供 
电 、 人 散热， 并 连接 各 槽 位 计算 节点 和 存储 节点 的 iMana、 交 换 模块 的 BMC。 


3.12 本章 总 结 


完成 本 章 学 习 ， 将 能 够 : 


66 信息 存储 与 IT 管理 


了 解 服务 器 的 历史 及 发 展 。 
掌握 服务 器 基本 硬件 架构 及 软件 组 件 。 
熟悉 服务 器 具备 的 常用 技术 。 
了 解 服务 器 的 基本 应 用 。 
了 解 服务 器 的 选 型 需求 。 
本 章 主要 介绍 服务 器 的 基本 知识 ， 包 括 服务 器 的 概念 、 服 务 器 的 分 类 与 技术 应 用 、 
服务 器 中 各 组 件 的 概述 与 具体 的 技术 、 服 务 器 的 高 级 技术 与 发 展 、 服 务 器 操作 系统 与 文 
件 系统 、 服 务 器 集群 、 数 据 库 以 及 华为 服务 器 的 实现 与 应 用 。 


3.13 ”练习 题 


一 、 选 择 题 
1. 按照 服务 器 的 处 理 器 架构 划分 ， 可 分 为 Ja 
A. VLIW 架构 服务 器 B. CISC 架构 服务 器 
C. x86 服务 器 D. RISC 架构 服务 器 
答案 (ABD) 
2. 为 了 解决 同位 查 码 技术 的 缺陷 而 产生 的 内 存 纠 错 技术 是 ( Js 
A. Chipkill B. 热 插 拔 
C. S.M.A.R.T D. Advanced ECC Memory 
答案 (D) 
3. 服务 器 的 操作 系统 通常 包含 Je 
A. Windows 类 B. Linux 类 
C. UNIX % D. NetWare 类 
答案 (ABCD) 
4. 服务 器 的 智能 监控 管理 包括 〈 
A. BMC B. ISC 
C. EMP D. SNMP 
答案 (CD) 
5. 华为 公司 的 服务 器 管理 软件 是 〈 js 
A. Openview B. OpForce 
C. USM D. LCSMS 
ER (C) 
6. 服务 器 常用 总 线 技术 包括 C 
A. PCI B. PCI-E C PCEX D. AGP 
答案 (BC) 
7. ARS aS, SLR NAT C Js 
A. JAA B. 电源 C. 网 卡 D. WA 


答案 (ABD) 
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二 、 简 管 题 

1. 简 述 CISC. RISC 以 及 VLIW 的 特点 。 

2. 有 人 认为 服务 器 朝 着 大 的 方向 发 展 ， 形 成 功能 强大 的 服务 器 系统 ， 也 有 人 认为 
服务 器 朝 着 小 的 方向 发 展 ， 以 满足 个 人 用 户 日 益 增 长 的 需求 ， 你 怎么 认为 ? 


4.1 
4.2 
4.3 
4.4 
4.5 
4.6 
4.7 





RAID 基 本 概念 与 技术 原理 

RAID 级 别 

RAID 中 的 数据 保护 技术 

RAID 与 LUN 

云 计 算 和 大 数据 时 代 RAID 的 发 展 趋势 
本 章 总 结 

练习 题 





关于 本 章 


单个 磁盘 的 容量 和 性 能 非常 有 限 ， 也 不 具备 容错 性 ， 为 了 能 够 实现 大 规模 存储 设备 并 
行 ， 增 强 系 统 的 容错 能 力 ， 一 种 专用 于 磁盘 资源 整合 和 元 余 保 护 的 技术 应 运 而 生 ， 这 就 是 元 
余 磁盘 阵列 (redundant arrays of independent disks，RAID， 简 称 磁盘 阵列 ) 。 随 着 云 计算 和 
大 数据 技术 的 飞速 发 展 ， 具 有 高 性 能 和 高 可 靠 性 的 磁盘 阵列 ， 在 大 规模 的 数据 中 心中 已 得 到 
越 来 越 广泛 的 应 用 。 

磁盘 阵列 既 可 以 单独 使 用 ， 也 可 以 通过 集成 的 方式 将 整个 阵列 中 的 磁盘 组 合 起 来 ， 形 成 
一 个 虚拟 的 “大 容量 磁盘 ”。 在 实际 应 用 中 ， 应 用 服务 器 将 此 磁盘 阵列 视 作 一 个 磁盘 来 进行 
操作 ， 而 数据 究竟 存储 在 该 阵列 的 哪 一 个 磁盘 上 ， 则 交 给 阵列 控制 器 负责 管理 ， 这 就 是 磁盘 
阵列 等 高 级 存储 系统 功能 的 基础 。 

本 章 将 从 RAID 的 基本 概念 与 技术 原理 、RAID 级 别 、RAID 中 的 数据 保护 技术 、RAID 与 
LUN、 以 及 云 计算 和 大 数据 时 代 RAID 的 发 展 趋势 几 个 方面 对 RAID 技 术 及 应 用 进行 介绍 。 
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4.1 RAID 基本 概念 与 技术 原理 


在 早期 的 服务 器 中 ， 单 个 存储 设备 被 广泛 使 用 ， 但 是 单个 存储 设备 无 法 满足 对 数据 
读 写 性 能 要 求 较 高 的 系统 的 需求 。 具 体 原因 如 下 。 

。 单个 的 磁盘 容量 有 限 ， 无 法 实现 容量 动态 扩展 。 

。 不 具备 容错 性 ,而 且 只 能 对 数据 块 进行 逐一 读 写 , 无 法 实现 数据 的 并 行 读 写 ， 因 

此 无 法 满足 对 数据 读 写 性 能 要 求 较 高 的 系统 的 需求 。 

为 了 能 够 实现 存储 容量 的 动态 扩展 ， 同 时 增强 系统 的 容错 能 力 ， 提 高 存储 系统 的 读 
写 性 能 ， 出 现 了 一 种 专用 于 在 服务 器 和 磁盘 之 间 实 现 磁盘 资源 整合 和 磁盘 元 余 功 能 的 设 
备 一 一 磁盘 阵列 。 

用 这 种 形式 配置 起 来 的 磁盘 阵列 ， 可 以 用 集成 的 模式 将 整个 阵列 中 的 磁盘 组 合 起 
来 ， 形 成 一 个 虚拟 的 “大 容量 磁盘 ”来 使 用 。 这 种 虚拟 的 “大 容量 磁盘 ”可 以 使 用 整个 
阵列 的 容量 。 


4.1.1 RAID 概述 


RAID 的 概念 是 1987 年 由 美国 加 州 大 学 伯克利 分 校 D. A. Patterson 教授 提出 的 ， 初 
次 出 现 是 “Redundant Arrays of Inexpensive Disks” 的 缩写 ， 意 为 “廉价 磁盘 见 余 阵列 ”。 
RAID 是 在 高 容量 、 高 可 靠 性 磁盘 价格 极为 昂贵 的 背景 下 提出 的 ， 其 主要 目的 是 采用 价 
格 低廉 的 磁盘 通过 某 种 算法 为 服务 器 提供 高 可 靠 性 的 大 容量 存储 空间 。 随 着 技术 的 发 展 
和 磁盘 价格 的 降低 ， 人 们 更 看 重 的 是 系统 的 元 余 性 ，RAID 逐渐 演变 为 了 独立 磁盘 元 余 
阵列 ， 主 要 是 指 多 个 独立 磁盘 通过 一 定 的 算法 组 成 一 个 高 可 靠 性 的 存储 系统 。 它 比 单个 
存储 设备 在 速度 、 稳 定性 和 存储 能 力 上 都 有 很 大 的 提高 ， 并 且 具 备 一 定 的 数据 安全 保护 
能 力 。 由 于 RAID 通常 需要 多 个 磁盘 驱动 器 协同 工作 ， 所 以 在 一 个 RAID 内 的 磁盘 驱动 
atthe (ABABA) 需要 保持 一 致 ， 通 常 建议 在 同一 个 RAID 内 ， 使 用 同一 厂商 、 
同一 型 号 的 磁盘 驱动 器 。 

1. RAID 的 主要 特征 

RAID 具备 如 下 主要 特征 。 

C1) 对 磁盘 上 的 数据 进行 条 带 化 分 布 ， 实 现 对 数据 条 带 化 存 取 ， 通 过 同时 读 取 阵列 
中 的 几 块 磁盘 ， 如 图 4-1 所 示 ， 减 少 磁盘 的 机 械 寻 道 时 间 ， 提 高 数据 存储 的 速度 。 


Data EE - 


4-1 并 行 读 取 示 意图 
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图 4-1 并 行 读 取 示 意图 〈 续 ) 
(2) 通过 镜像 或 者 存储 奇偶 校 验 信息 的 方式 ， 实 现 对 数据 的 见 余 保护 。 如 图 4-2 所 示 。 
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4-2 奇偶 检验 示意 图 





2. RAID 的 实现 方式 

目前 RAID 的 实现 方式 有 硬件 RAID 方式 和 软件 RAID 方式 两 种 。 

基于 硬件 的 RAID 采用 集成 了 处 理 器 的 RAD 适 配 卡 (简称 RAID F) KEM. € 
拥有 自己 的 控制 处 理 器 、L/O 处 理 蕊 片 和 存储 器 ， 减 少 对 主机 CPU 运算 时 间 的 占用 ， 提 
高 数据 传输 速率 。RAID 控制 器 负责 数据 路 由 、 缓 冲 以 及 主机 和 磁盘 阵列 之 间 的 数据 流 
管理 。 硬 件 RAID 又 分 为 基于 VO 处 理 器 和 基于 VO 控制 器 两 种 类 型 。 

由 于 目 带 的 处 理 器 能 够 分 担 系统 CPU 计算 RAID 的 资源 分 配 的 任务 , 所 以 给 系统 造 
成 的 负荷 轻 ， 具 有 较 好 的 读 写 性 能 。 但 是 价格 较为 高 昂 ， 适 用 于 对 性 能 和 可 人 靠 性 要 求 较 
高 的 系统 ， 如 Web 应 用 、 电 子 交 易 等 。 

基于 软件 的 RAID 功能 的 实现 完全 依赖 于 主机 的 CPU， 没 有 额外 的 处 理 器 和 VO i 
片 ， 所 以 低速 CPU 很 难 满足 这 个 需求 。 软件 RAID 又 分 为 基于 驱动 程序 和 基于 操作 系统 
两 种 类 型 。 软 件 RAID 需要 占用 CPU 的 处 理 周期 ,依赖 于 操作 系统 ， 并 且 不 能 提供 以 下 
功能 : 人 硬件 热 插 拔 、 硬件 热 备份 、 远 程 阵列 管理 、S.M.A.R.T (Self-Monitoring Analysis and 
Reporting Technology， 自 我 监测 、 分 析 及 报告 技术 ) 硬件 支持 等 。 
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基于 软件 的 RAID 价格 低廉 , 但 是 会 造成 较 大 的 系统 CPU 负荷 , 读 写 性 能 不 如 基于 
硬件 的 RAID， 适 用 于 对 性 能 要 求 不 高 的 系统 ， 如 中 小 型 数据 库 等 。 


4.1.2 RAID 的 种 类 


根据 RAID 中 磁盘 的 组 织 方 式 、 连 接 方式 以 及 数据 访问 方式 ， 可 以 将 RAD 分 为 
JBOD 和 SBOD 两 类 。 

1. JBOD 

Wk Hit fo (just a bunch of disks, JBOD) 也 有 资料 称 为 盘 堆 。 JBOD 是 磁盘 阵列 的 雏形 ， 
可 以 看 作 是 将 计算 机 总 线 扩展 提供 磁盘 扩展 模 位 的 设备 ， 它 内 部 没有 控制 软件 提供 协调 
控制 ， 不 具备 磁盘 资源 整合 和 RAID 元 余 功能 。 最 早 的 JBOD 多 采用 SCSI 总 线 接 口 ， 
随 着 时 间 的 推移 ， 现 在 的 JBOD 多 是 指 没有 磁盘 管理 和 RAID 元 余 功能 的 磁盘 柜 ， 连 接 
形式 有 SAS、FC、 了 P 等 多 种 。 不 管 采用 何 种 接口 ，JBOD 的 实现 均 如 图 4-3 所 示 。 


JBOD 








Disk 0 Disk 1 Disk 2 
图 4-3 JBOD 的 实现 


JBOD 其 目的 纯粹 是 为 了 增加 磁盘 的 容量 , 通常 又 被 称 为 Spans Span 是 在 逻辑 上 把 
多 个 物理 磁盘 连接 起 来 构成 一 个 阵列 ， 其 中 的 每 个 磁盘 驱动 器 都 是 一 个 可 寻 址 的 单元 ， 
从 而 为 主机 系统 提供 一 个 容量 更 大 的 逻辑 磁盘 。Span 上 的 数据 存储 方式 非常 简单 ， 从 第 
一 个 磁盘 开始 存储 ， 当 第 一 个 磁盘 的 存储 空间 用 完 后 ， 再 依次 从 后 面 的 磁盘 开始 存储 数 
据 。 因 为 Span 不 提供 数据 安全 保障 ， 所 以 当 阵 列 中 的 某 个 磁盘 出 现 故 障 时 ,这 种 配置 方 
式 不 能 提供 任何 容错 能 力 。 

从 逻辑 结构 上 来 看 ，JBOD 使 用 的 是 光纤 仲裁 环 路 (fiber channel arbitrated loop, 
FC-AL) 结构 作为 其 连接 到 系统 中 的 方式 ， 这 样 的 连接 方式 虽然 简单 易 行 ， 因 为 可 以 将 
多 个 磁盘 合并 到 共享 电源 和 风扇 的 盒子 里 ， 较 RAID 阵列 具有 成 本 低 的 优势 ， 但 是 也 由 
于 一 个 光纤 仲裁 环 路 上 连接 的 众多 设备 共享 其 带宽 ， 其 性 能 难以 提高 ， 而 且 诊断 和 隔离 
故障 磁盘 的 困难 也 大 大 影响 系统 的 可 靠 性 、 可 用 性 和 服务 能 力 (reliability. availability and 
serviceability，RAS)， 系 统 的 延 时 也 会 随 看 环 路 上 设备 的 增加 而 增 大 ， 因 此 ，JBOD H 
前 已 几乎 失去 了 应 用 价值 。 

2. SBOD 

SBOD: switched bunches of disks， 交 换 式 磁盘 捆绑 。 早 期 的 JBOD 磁盘 阵列 使 用 共 
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享 式 的 FC-AL， 环 路 中 JBOD 数量 的 增加 ， 会 显著 增加 系统 的 传输 延 时 ， 导 致 性 能 急剧 


下 滑 。 为 了 改善 传输 性 能 和 和 链 路 稳定 性 ， 技 术 人 员 将 目光 瞄准 在 交换 式 光 纤 架 构 上 ， 由 
此 ，SBOD 应 运 而 生 。SBOD 的 实现 如 图 4-4 所 示 。 


内 部 交换 矩阵 


i EIS RS i 


内 部 交换 矩阵 








内 部 交换 和 矩阵 


Py ÈR AS Be He RE 


NAS 机 头 /RAID 控制 器 


图 4-4 SBOD 的 实现 


SBOD 使 用 内 置 的 交换 式 光 纤 架 构 来 链接 阵列 内 的 众多 磁盘 驱动 器 ， 从 而 能 够 在 避 
免 单个 磁盘 失效 影响 数据 可 用 性 并 智能 监视 每 个 磁盘 的 同时 ， 获 得 2~3 倍 的 性 能 提升 ， 
RAID 控制 器 到 所 有 磁盘 间 的 路 径 也 大 为 缩短 。 在 一 个 SBOD 阵列 内 的 磁盘 驱动 器 、 
SBOD 阵列 与 控制 器 之 间 的 链 路 均 实 现 无 阻塞 的 交换 式 光 纤 交 换 ， 直 接 的 数据 路 径 提高 
了 可 扩展 性 和 服务 能 力 。 

相 较 于 JBOD 而 言 , SBOD 采用 的 全 交换 架构 的 性 能 可 以 随 磁盘 数量 的 增加 而 上 升 ， 
而 共享 带宽 的 环 路 架构 在 磁盘 数量 达到 30 一 40 个 时 就 显露 出 性 能 增 势 减 缓 的 迹象 , 并 随 
着 人 磁盘 数量 的 进一步 增加 而 渐 趋 停滞 不 前 ， 两 者 的 差距 显而易见 。 


41.3 RAID 的 原理 


下 面 介绍 RAID 原理 ， 包 括 RAID 的 数据 组 织 方 式 、 数 据 存 取 方 式 以 及 数据 见 余 方式 。 
l. RAID 的 数据 组 织 方式 
RAID 的 基本 示意 图 如 图 4-5 所 示 。 
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4-5 RAID 的 数据 条 带 分 布 示意 图 


条 带 〈strip) 是 指 在 单个 阵列 磁盘 上 ， 一 系列 连续 编 址 的 磁盘 块 。 磁 盘 阵 列 使 用 分 
条 来 将 虚拟 磁盘 块 地 址 映射 为 编号 的 磁盘 块 地 址 。 

分 条 (stripe) 是 在 使 用 分 条 数据 映射 的 磁盘 阵列 中 ， 每 个 编号 的 磁盘 阵列 盘 区 相应 
位 置 的 一 系列 条 带 。 条 带 之 间 通 过 某 种 方式 〈 如 盘 区 块 地 址 ) 互相 关联 ， 使 分 条 中 的 成 
员 关 系 能 够 被 计算 算法 快速 、 唯 一 地 确定 。 

分 块 是 将 一 个 条 带 分 成 多 个 大 小 相等 、 地 址 相 邻 的 块 ， 这 些 块 被 称 为 分 块 。 它 是 组 
成 条 带 的 元 素 。 

用 于 描述 条 带 中 容量 大 小 的 术语 通常 有 两 个 : 分 条 深度 和 分 条 尺寸 。 

(1) 分 条 深度 (stripe depth) 

分 条 深度 是 指 在 使 用 分 条 数据 映射 的 磁盘 阵列 中 ， 条 带 内 的 块 数量 ， 也 指 在 磁盘 阵 
列 的 单个 成 员 盘 区 中 ， 连 续 编 址 的 虚拟 磁盘 块 映射 到 连续 编 址 的 块 的 数量 。 分 条 深度 的 
大 小 直接 影响 应 用 效果 ， 应 根据 任务 配置 ， 总 的 原则 是 如 果 是 大 的 数据 流 / 块 任务 ， 则 分 
条 深度 可 以 大 些 ， 反 之 可 以 设置 得 小 些 。 如 果 任 务 数据 流 / 块 较 大 而 分 条 深度 较 小 ， 则 会 
导致 数据 流 / 块 跨越 多 个 分 块 ， 读 取 多 个 分 块 需要 更 多 的 操作 与 时 间 ， 使 系统 开销 增 大 ， 
降低 系统 性 能 ; 如 果 数 据 流 / 块 较 小 而 分 条 深度 较 大 , 由 于 块 是 RAID 中 最 小 的 存储 单元 ， 
所 以 会 使 每 个 分 块 的 实际 空间 利用 率 较 低 。 

(2) FART (stripe size) 

分 条 尺寸 是 指 分 条 中 块 的 数量 。 分 条 阵列 的 分 条 尺寸 ， 是 分 条 深度 乘 以 成 员 盘 区 的 
数量 。 

在 RAID 的 数据 存储 中 ， 数 据 不 是 连续 地 存储 到 某 一 块 磁盘 上 的 ， 而 是 被 分 成 若干 
段 ， 将 每 一 段 数 据 分 布 存储 在 各 块 磁 盘 上 。 在 这 个 过 程 中 ， 每 块 磁盘 上 用 来 存储 数据 段 
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的 空间 叫 作 分 块 。 而 在 同一 磁盘 阵列 中 的 多 个 磁盘 上 相同 “位 置 ”( 或 者 说 相同 编号 ) 的 
分 块 就 构成 了 条 带 。 通 过 这 样 的 构建 方式 ， 形 成 一 个 虚拟 的 磁盘 ， 当 主机 端 发 送 的 IO 
请 求 传送 到 磁盘 阵列 时 ， 阵 列 管理 软件 会 同时 产生 多 个 内 部 的 IO 请 求 并 确定 在 每 块 磁 
盘 上 的 对 应 地 址 。 阵 列 中 的 分 条 被 映射 为 虚拟 磁盘 中 逻辑 上 连续 的 块 ， 当 主机 向 阵列 也 
就 是 从 虚拟 磁盘 写 数 据 时 ， 阵 列 管理 软件 将 输入 的 LO 请 求 转换 为 阵列 中 的 分 条 ， 逐 块 
向 磁盘 写 入 数据 。 块 〈block) 是 磁盘 中 存储 数据 的 最 小 单位 。 

2. RAID 的 数据 存 取 方 式 

由 于 RAID 实际 上 是 多 个 磁盘 的 集合 体 ， 当 主机 系统 在 向 RAID 读 写 数据 时 ， 实 际 
上 是 由 控制 器 将 IO 流 分 给 RAID 中 的 磁盘 进行 读 写 操作 。 因 此 ， 对 磁盘 的 控制 方式 ， 
也 是 RAID 系统 中 重要 的 功能 之 一 。 

RAID 具有 两 种 数据 存 取 方 式 : 并 行 存 取 和 独立 存 取 。 

(1) 并 行 存 取 

并 行 存 取 是 精密 控制 所 有 磁盘 的 主 
轴 马 达 ， 使 每 个 磁盘 的 位 置 都 彼此 同步 ， _ 
然后 对 每 一 个 磁盘 进行 很 短 的 IO 数据 传 | 
送 ， 如 图 4-6 所 示 ， 如 此 一 来 ， 从 主机 来 
的 每 一 个 IO 指令 ， 平 均 分 布 到 每 一 个 磁 
盘 。 为 了 达到 并 行 存 取 的 功能 ，RAID 中 i 
的 每 一 块 磁盘 ， 都 必须 具备 几乎 完全 相同 
的 规格 : 转速 必须 一 致 ， 磁 头 搜 寻 速 度 必 
须 相同 ， 缓 存 的 容量 和 存 取 速 度 要 一 致 ， Ey 
CPU 处 理 指令 的 速度 要 相同 ，L/O Channel 
的 速度 也 要 一 样 。 实 际 上 ， 要 利用 并 行 存 
取 ，RAID 中 的 所 有 磁盘 应 该 使 用 同一 厂 er 
商 相同 型 号 的 产品 。 并 行 存 取 RAID 架 stam ki 
构 ， 利 用 精细 的 马达 控制 和 分 布 的 数据 传输 ， 将 阵列 中 每 一 个 磁盘 的 性 能 发 挥 到 最 大 ， 
同时 充分 利用 存储 总 线 的 带宽 ， 因 此 特别 适合 应 用 在 大 型 、 数 据 连 续 的 档案 存 取 任 务 ， 
例如 : 

影像 、 实 训 档 案 服 务 器 。 

数据 仓储 系统 。 

多 媒体 数据 库 。 

电子 图 书馆 。 

印 前 或 底片 输出 档案 服务 器 。 

其 他 大 型 且 连 续 性 档案 服务 器 。 

由 于 并 行 存 取 RAID 架构 的 特性 , RAID 控制 器 一 次 只 能 处 理 一 个 IO 请 求 , 无 法 执 
行 多 个 任务 ， 因 此 并 不 适合 应 用 在 VO 频繁 、 数 据 随 机 存 取 、 每 次 数据 传输 量 小 的 环境 。 
同时 ， 并 行 存 取 无 法 执行 多 个 任务 ， 无 法 避免 磁盘 的 寻 道 时 间 ， 而 且 在 每 一 个 IO 第 一 
次 数据 传输 时 ， 都 要 等 待 第 一 个 磁盘 驱动 器 的 旋转 寻 道 延迟 〈 平 均 为 磁盘 旋转 半 圈 的 时 
间 尖 -因此 磁盘 驱动 器 的 机 械 延 时 是 并 行 存 取 架 构 面临 的 最 大 问题 。 
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(2) 独立 存 取 

独立 存 取 并 不 对 成 员 磁 盘 作 同步 转动 的 控制 ， 其 对 每 块 磁盘 的 存 取 都 是 独立 上 且 没有 
顺序 和 时 间 间 隔 的 限制 。 因此 , 独立 存 取 可 以 尽量 利用 多 任务 TCQ 来 避免 磁盘 驱动 器 的 
机 械 时 间 延 迟 ( 寻 道 时 间 和 旋转 延迟 )。 由 于 独立 存 取 可 以 做 重 登 多 任务 ， 而 且 可 以 同时 
处 理 来 自 多 个 主机 的 不 同 IO 请 求 ， 在 多 主机 环境 (如 Clustering) 中 ， 能 发 挥 更 大 的 性 
能 。 由 于 独立 存 取 可 以 同时 接收 多 个 IO 请 求 ， 因 此 特别 适合 应 用 在 数据 存 取 频繁 、 每 
次 数据 量 较 小 的 系统 中 。 例 如 : 

在 线 交 易 或 电子 商务 应 用 。 

多 用 户 数 据 库 。 

ERM 以 及 MRP 系统 。 

以 小 文件 传输 和 存储 为 主 的 文件 服务 器 。 

Tagged Command Queuing〔 标 记 命 令 队 列 ) 等 的 高 阶 功能 。 

3. RAID RHE TAA A 

RAID 相 较 于 JBOD 和 SBOD 而 言 ， 不 仅 提供 更 大 的 容量 ， 而 且 能 提供 更 高 的 性 能 
和 更 好 的 数据 安全 可 靠 性 。RAID 可 以 通过 不 同 的 方式 对 数据 进行 不 同 级 别 的 保护 ， 包 
括 使 用 镜像 元 余 和 校 验 元 余 。 

(1) 镜像 元 余 

镜像 元 余 方 式 是 指使 用 磁盘 镜像 技术 来 实现 见 余 ， 以 提高 数据 的 可 靠 性 和 可 用 性 。 
镜像 元 余 的 实质 就 是 将 保存 在 磁盘 驱动 器 中 的 数据 做 一 份 另 外 的 完整 拷贝 ， 然 后 存储 在 
男 外 一 个 磁盘 中 。 当 其 中 一 个 磁盘 发 生 故 障 以 后 , 数据 仍然 能 够 从 男 一 个 磁盘 中 被 读 出 ， 
数据 的 安全 性 和 可 靠 性 得 到 极 大 的 保证 。 数 据 镜像 如 图 4-7 Ata. 





图 4-7 数据 镜像 示意 图 


镜像 见 余 可 以 得 到 最 好 的 数据 见 余 保护 ， 并 且 由 于 每 个 磁盘 上 都 保存 有 完整 的 数 
据 ， 所 以 当 有 数据 读 操作 时 ， 多 个 读 操 作 可 以 被 分 散 到 各 个 人 磁盘 以 分 担 工作 负荷 ， 提 高 
数据 读 取 速度 ,但 是 镜像 见 余 的 磁盘 空间 利用 率 相 对 较 低 ， 最 高 只 有 50%。 镜 像 风 余 方 
式 适 用 于 对 数据 安全 性 和 可 靠 性 要 求 极 高 的 场合 ， 如 人 金融、 保险 和 证 券 行业 等 。 

(2) 校 验 元 余 

校 验 元 余 是 通过 计算 保存 在 阵列 中 磁盘 上 的 数据 的 校 验 值 ， 并 将 计算 出 来 的 校 验 值 
保存 在 另外 的 磁盘 上 的 方法 。 当 数据 出 错 或 者 某 个 阵列 中 的 磁盘 故障 时 ， 通 过 剩余 数据 
和 校 验 信息 计算 出 丢失 的 数据 来 提供 数据 的 安全 性 和 可 靠 性 。RAID 使 用 的 校 验算 法 主 
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要 包括 海 明 码 校 验算 法 和 KOR 异 或 算法 。 由 于 海 明 码 计算 过 程 较为 复杂 ， 需 要 多 块 磁 
盘 用 于 检验 数据 的 保存 ， 因 此 应 用 较 少 ， 目 前 比较 常用 的 算法 为 XOR 异 或 算法 。 

当 新 的 磁盘 要 替代 阵列 中 失效 的 磁盘 时 ， 会 运行 一 个 校 验 恢复 进程 来 读 出 所 有 其 他 
磁盘 上 的 数据 (包括 校 验 数据 )， 然 后 在 新 加 入 的 磁盘 上 使 用 校 验 算法 恢复 数据 。/ 

相 较 于 镜像 元 余 而 言 ， 校 验 元 余 为 保证 数据 可 用 性 而 占用 的 磁盘 资源 要 远 远 少 于 镜 
像 元 余 。 但 是 ， 对 于 磁盘 故障 或 者 数据 出 错 的 恢复 而 言 ， 校 验 元 余 需要 占用 额外 的 CPU 
资源 或 者 需要 专用 硬件 来 对 剩余 数据 和 校 验 信 息 一 起 计算 出 丢失 的 数据 ， 而 镜像 元 余 方 
式 只 需要 读 取 备份 盘 中 的 数据 即 可 。 对 于 数据 的 写 入 操作 ， 镜 像 元 余 方 式 可 以 同时 将 数 
据 写 入 主 用 盘 和 备用 盘 ， 对 数据 写 入 效率 基本 没有 影响 。 但 是 如 果 使 用 校 验 元 余 ， 对 阵 
列 中 的 任何 一 块 磁盘 的 写 操作 都 会 涉及 校 验 信息 的 重新 计算 ， 因 此 会 对 存储 系统 的 写 性 
能 带 来 一 定 的 影响 。 

(3) 海 明 码 

海 明 码 (Hamming code) 是 一 种 可 以 纠正 一 位 差错 的 编码 。 它 是 利用 在 信息 位 为 上 
位 ， 增 加 r 位 元 余 位 ， 构 成 一 个 n=ktr 位 的 码 字 ， 然 后 用 > 个 监督 关系 式 产 生 的 > 个 校 
正 因子 来 区 分 无 错 和 在 码 字 中 的 n 个 不 同位 置 的 一 位 错 。 它 必须 满足 以 下 关系 式 : 

2^r>=n+1 或 2^r>=ktr+l1 


海 明 码 的 编码 效率 为 : 

R=k/ (ktr) 
式 中 为 信息 位 位 数 ，r 为 元 余 位 位 数 。 
海 明 码 的 构建 方法 如 下 。 


把 所 有 2 的 窘 次 方 的 数据 位 标记 为 奇偶 校 验 位 (编号 为 1、2、4、8、16、32、64 
等 的 位 置 )。 

其 他 数据 位 用 于 竺 编码 数据 (编号 为 3、5、6、7、9、10、11、12、13、14、15、 
17 等 的 位 置 )。 

每 个 奇偶 校 验 位 的 值 代表 了 码 字 中 部 分 数据 位 的 奇偶 性 ， 其 所 在 的 位 置 决 定 了 要 校 ， 
验 和 跳 过 的 位 顺序 。 

如 果 全 部 校 验 的 位 置 中 有 奇数 个 1， 则 将 该 奇偶 检验 位 置 为 1， 否则 置 为 0。 

例如 : 

原始 数据 为 : 10010111 

增加 码 位 为 :0 001 0111 

生成 海 明 码 为 : 101000110111 

(4) XOR 异 或 算法 

异 或 是 一 个 数学 运算 符 ， 可 应 用 于 逻辑 运算 。XOR 检 校 的 算法 为 : 相同 为 假 ， 相 异 
为 真 。 部 分 计算 机 系统 用 1 表示 真 ， 用 0 表示 假 ， 两 个 位 按 位 异 或 结果 如 下 。 

0 © 0=0 

1 ®0=1 

0e 1=1 

1 @1=0 

XOR 的 逆 运 算 仍 为 XOR. HTA XOR 运算 具备 以 下 两 个 特征 : 
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O 结果 与 运算 顺序 无 关 。 

D 各 个 参加 运算 的 数字 与 结果 循环 对 称 。 

比较 上 述 两 种 检 校 算法 ， 虽 然 海 明码 能 够 提供 更 好 的 元 余 ， 提 升 数据 的 可 靠 性 ， 但 
是 ， 由 于 其 复杂 的 计算 过 程 极 大 地 降低 了 系统 的 读 写 性 能 以 及 元 余 磁 盘 数 较 多 ， 比 起 性 
能 的 巨大 亏损 与 空间 利用 率 的 降低 ， 安 全 性 的 提升 并 不 显著 ， 因 此 目前 应 用 较 多 的 检 校 
算法 是 XOR 异 或 算法 。 


4.2 RAID 级 别 


RAID 技术 经 过 不 断 的 发 展 ,现在 已 拥有 了 RAID-0 一 RAID-6 7 种 基本 的 RAID 级 别 。 
另外 ， 还 有 一 些 基 本 RAID 级 别 的 组 合 形式 ， 如 RAID-10 (RAID-1 与 RAID-0 的 组 合 )、 
RAID-50 (RAID-5 与 RAID-0 的 组 合 ) 等 。 不 同 RAD 级 别 代表 不 同 的 存储 性 能 、 数 据 
安全 性 和 存储 成 本 。 以 下 会 逐一 介绍 各 个 RAID 级 别 的 工作 原理 。 


4.2.1 RAID-0 


RAID-0 也 称 为 条 带 化 (stripe), 其 原理 是 将 多 个 物理 磁盘 合并 成 一 个 大 的 逻辑 磁盘 ， 
它 代表 了 所 有 RAID 级 别 中 最 高 的 存储 性 能 ， 不 具有 宛 余 ， 不 能 并 行 VO， 但 速度 最 快 。 
在 存放 数据 时 ， 根 据 构建 RAID-0 的 磁盘 个 数 对 数据 进行 分 段 ， 然 后 同时 将 这 些 数据 并 
行 写 进 磁盘 中 ， 因 此 在 所 有 的 级 别 中 ;RAID-0 的 速度 是 最 快 的 。 但 是 RAID-0 RELA 
功能 ， 如 果 一 个 物理 磁盘 损坏 ， 则 所 有 的 数据 都 会 丢失 。 

从 理论 上 讲 ， 磁 盘 个 数 和 总 磁盘 性 能 应 该 成 倍数 关系 ， 总 磁盘 性 能 等 于 “单一 磁盘 
性 能 x 磁盘 数 ”。 但 实际 上 受 限 于 总 线 VO 瓶颈 及 其 他 因素 的 影响 ，RAID 性 能 随 磁盘 个 
数 的 增加 不 再 是 倍数 关系 ， 也 就 是 说 ， 假 设 一 个 磁盘 的 性 能 是 50MB/s， 两 个 磁盘 的 
RAID-0 性 能 约 为 96MB/s，3 个 磁盘 的 RAID-0 也 许 是 130MB/s 而 不 是 150MB/s， 所 以 
两 个 磁盘 的 RAID-0 最 能 明显 感受 到 性 能 的 提升 。 

RAID-0 实现 原理 如 下 。 

图 4-8 中 有 Disk 1 和 Disk 2 两 个 磁盘 ，RAID-0 的 做 法 是 将 
要 储存 的 内 容 (A1，A2...……) 根据 磁盘 数目 分 成 两 部 分 同时 储 
存 。Al 和 A2 分 别 储存 到 Disk 1 和 Disk 2 F, 等 到 Al 储存 完成 
后 ， 开 始 将 A3 储存 进 Disk 1 中 ， 其 余数 据 块 同 理 。 这 样 可 以 将 
两 个 磁盘 看 成 一 个 大 磁盘 ， 并 且 两 侧 同 时 进行 YO. ARE 
块 数据 坏 掉 ， 整 个 数据 就 会 丢失 。 

RAID-0 的 读 写 性 能 较 好 , 但 是 没有 数据 见 余 ， 因此 RAID-0 
本 喘 适用 于 对 数据 访问 具有 容错 能 力 的 应 用 , 以 及 能 够 通过 其 他 
途径 重新 形成 数据 的 应 用 ， 如 Web 应 用 以 及 流 媒 体 。 图 4-8 RAID-0 示意 图 


4.2.2 RAID-1 


RAID-1 又 称 为 Mirror 或 Mirroring (RO), 它 的 目的 是 最 大 限度 地 保证 用 户 数据 的 
可 用 性 和 可 修复 性 。RAID-1 的 原理 是 把 用 户 写 入 硬盘 的 数据 百分之百 地 自动 复制 到 另 
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外 一 个 硬盘 上 。 

RAID-1 在 主 硬盘 上 存放 数据 的 同时 ， 也 在 镜像 硬盘 上 写 同样 的 数据 。 当 主 硬盘 损 
坏 时 ， 镜 像 硬 盘 代 替 主 硬盘 的 工作 。 因 为 有 镜像 硬盘 做 数据 备份 ， 所 以 RAID-1 的 数据 
安全 性 是 所 有 RAID 级 别 中 最 好 的 。 但 是 无 论 用 多 少 磁盘 做 ee 
RAID-1， 有 效 数 据 空 间 大 小 仅 为 单个 磁盘 容量 ， 是 所 有 RAID 上 
磁盘 利用 率 最 低 的 一 个 级 别 。 

RAID-1 实现 原理 如 下 。 

图 4-9 中 ， 在 储存 数据 时 ， 将 要 储存 的 内 容 CAI, A2......) 
存储 进 主 磁盘 Disk 1， 同 时 在 Disk 2 中 再 次 将 数据 储存 一 遍 ， 以 
达到 数据 备份 的 目的 。 

RAID-1 是 所 有 RAID 级 别 中 单位 存储 成 本 最 高 的 , 但 因 其 提 
供 了 几乎 最 高 的 数据 安全 性 和 可 用 性 ， 所 以 RAID-1 适用 于 读 操 
作 密 集 的 OLTP 和 其 他 要 求 数据 具 有 较 高 读 写 性 能 和 可 靠 性 的 应 pet 
用 ， 如 电子 邮件 、 操 作 系统 、 应 用 程序 文件 和 随机 存 取 环境 等 。 图 49 RAD- 不 意图 


4.2.3 RAID-2 


RAID-2 是 一 种 大 型 机 和 超级 计算 机 用 来 储存 的 带 海 明 码 校 验 的 磁盘 阵列 ， 在 磁盘 
中 ， 有 一 部 分 磁盘 驱动 器 是 专门 的 校 验 盘 ， 用 于 校 验 和 纠 错 。 由 于 有 校 验 盘 的 存在 ， 所 
以 数据 整体 的 空间 占用 会 比 原始 数据 大 一 些 。RAID 2 对 大 数据 量 的 读 写 具有 极 高 的 性 
能 ， 但 读 写 少量 数据 时 的 性 能 反而 不 好 ， 所 以 RAID 2 实际 使 用 较 少 。 

RAID-2 实现 原理 如 下 ， 如 图 4-10 所 示 ， 左 边 的 Disk 1、Disk 2、Disk 3、Disk 4 为 数 
据 阵 列 ， 阵 列 中 的 每 个 硬盘 一 次 只 存储 一 位 的 数据 。 右 边 的 阵列 〈 即 为 校 验 阵 列 ) 则 是 存 
储 相 应 的 海 明 码 ， 也 是 一 位 一 个 硬盘 。 因 此 RAID 2 中 的 硬盘 数量 取决 于 所 设 定 的 数据 存 
储 宽度 。 如 果 是 4 位 的 数据 宽度 ， 那 么 需要 4 个 数据 硬盘 和 3 个 海 明 码 校 验 硬盘 ， 根 据 海 
明码 的 计算 方法 ， 如果 有 2 的 入 次 震 位 的 数据 宽度 ， 则 需要 2^N 块 磁盘 ， 校 验 阵列 需要 入 
块 磁盘 。 例 如 ， 如 果 是 64 位 的 位 宽 ， 则 从 海 明 码 的 计算 方法 中 ， 可 以 算出 来 ， 数 据 阵列 
需要 64 块 硬盘 ， 校 验 阵 列 需 要 7 块 硬盘 。 可 以 看 出 数据 越 大 ，RAID-2 需要 的 校 验 矩 阵 数 
就 越 小 ， 这 也 是 为 什么 RAID-2 适合 大 颗粒 数据 储存 而 不 适合 一 般 数 据 储存 的 原因 。 





RAID-2 
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图 4-10 RAID-2 示意 图 
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4.2.4 RAID-3 


RAID-3 为 带 有 专用 奇偶 位 校 验 码 的 RAID， 其 利用 异 或 逻辑 运算 原理 来 进行 校 验 ， 
和 RAID-2 比较 起 来 ， 异 或 逻辑 运算 比 汉 明 码 简 单 实 用 ， 并 且 能 大 量 降低 成 本 。 异 或 逻 
辑 运算 结果 如 表 4-1 所 示 。 


表 4-1 异 或 运算 结果 表 





A 与 B 代表 两 个 值 ， 当 A=B 时 ， 异 或 结果 为 0， 当 A#B 时 ， 异 或 结果 为 1。 知道 
其 中 任意 两 个 值 就 可 以 得 到 第 3 个 值 ， 从 而 可 以 达到 校 验 码 的 目的 。 

从 图 4-11 中 可 以 看 到 ，RAID-3 采用 和 RAID-0 一 样 的 分 成 条 带 〈strip) 储存 数据 ， 
Disk 4 则 是 用 来 储存 校 验 码 信息 ， 其 中 A3 Al A2 和 A3 的 奇偶 校 验 信 息 ， 其 他 以 
此 类 推 。 由 于 储存 方式 和 RAID-0 类 似 ， 因 此 RAID-3 拥有 很 高 的 数据 传输 效率 。 


RAID-3 





Disk | Disk 2 Disk 3 Disk 4 
4-11 RAID-3 示意 图 


4.2.5 RAID-4 


RAID-4 是 与 RAID-3 相 类 似 的 奇偶 校 验 码 RAID. EH RAID-3 不 同 的 是 ， 它 在 分 
区 时 是 以 区 块 为 单位 分 别 存 在 硬盘 中 ， 即 RAID-4 是 以 数据 块 为 单位 存储 的 ， 如 图 4-12 
所 示 ， 可 以 这 样 来 理解 ， 一 个 数据 块 是 一 个 完整 的 数据 集合 ， 比 如 一 个 文件 就 是 一 个 典 
型 的 数据 块 ，RAID-3 则 是 按 位 或 字 节 交叉 存 取 的 。 对 比 之 下 ，RAID-4 这 样 按 块 存 储 可 
以 保证 块 的 完整 ， 不 受 因 分 条 带 存 储 在 其 他 硬盘 上 而 可 能 产生 的 不 利 影响 (如 当 其 他 多 
个 硬盘 损坏 时 ， 数 据 就 损坏 了 )。 

目前 除了 少 部 分 商用 机 器 采用 RAID-4 的 设计 以 外 ， 其 余 RAID-4 的 应 用 已 经 较 
DTe 
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4.2.6 RAID-5 


RAID-5 是 高 级 RAID 系统 中 最 常见 的 一 种 RAID 级 别 , 由 于 其 出 色 的 性 能 与 数据 见 
余 平衡 设计 而 被 广泛 采用 。 其 全 名 为 “独立 的 数据 磁盘 与 分 布 式 校 验 块 >。 与 前 面 的 
RAID-3 和 RAID-4 一 样 ，RAID-5 也 是 用 奇偶 校 验 来 进行 校 验 和 纠 错 。 但 设计 得 更 为 巧 
妙 ， 并 且 实 用 性 更 好 。 

在 图 4-13 中 ，RAID-5 也 是 采用 了 和 RAID-4 一 样 的 数据 块 存储 方式 ， 但 是 相 比 较 
RAID-3 和 RAID-4, RAID-5 没有 独立 的 校 验 磁 盘 ， 这 是 因为 它 在 每 个 磁盘 都 存放 了 用 
户 数据 和 和 元 余 数据 。 例 如 ，A 是 A1、A2、A3 的 奇偶 校 验 数据 ， 其 他 以 此 类 推 。 





Disk 1 Disk 2 Disk 3 Disk 4 Disk 1 Disk 2 Disk 3 Disk 4 
4-12 RAID-4 示意 图 4-13 RAID-5 示意 图 


当 RAID-5 的 一 个 磁盘 数据 损坏 后 ， 可 以 利用 剩 下 的 数据 和 相应 的 奇偶 校 验 信息 恢 
复 被 损坏 的 数据 。 因 此 ，RAID-5 是 一 种 存储 性 能 、 数 据 安 全 和 存储 成 本 兼顾 的 存储 解 
决 方案 。 

RAID-5 尽管 有 一 些 容量 上 的 损失 ,但 是 能 够 提供 最 佳 的 整体 性 能 ， 因 而 也 是 被 广 
泛 应 用 的 一 种 数据 保护 方案 。 它 适合 于 VO 密集 、 高 读 / 写 比率 的 应 用 , 如 联机 事务 处 理 等 。 


4.2.7 RAID-6 


RAID-6 是 为 了 进一步 加 强 数据 保护 而 设计 的 一 种 RAID 方式 ， 与 RAID-5 相 比 ， 
RAID-6 增加 了 第 二 种 独立 的 奇偶 校 验 信息 块 。 这 样 一 来 ， 等 于 每 个 数据 块 有 了 两 个 校 
验 保护 屏障 一 个 分 层 校 验 ， 一 个 是 总 体 校 验 )， 因 此 RAID-6 的 数据 元 余 性 能 非常 好 。 
但 是 ， 由 于 增加 了 一 个 校 验 ， 所 以 写 入 的 效率 较 RAID-5 还 差 ， 而 且 控 制 系 统 的 设计 也 
更 为 复杂 ， 第 二 块 的 校 验 区 也 减少 了 有 效 存 储 空 间 。 

常见 的 RAID-6 技术 有 PH 和 DP， 两 种 技术 获取 校 验 信 息 的 方法 不 同 ， 但 是 都 可 
以 允许 整个 阵列 中 两 块 磁盘 数据 丢失 。 

P+Q: PH 需要 计算 出 两 个 校 验 数据 P 和 Q， 当 有 两 个 数据 丢失 时 ， 根 据 P 和 Q 恢 
复出 丢失 的 数据 。 校 验 数据 P 和 Q 是 由 以 下 公式 计算 得 来 的 。 

P=D0eD1eD2 
Q=(ae D0)e(peDlb)eweD2) 
在 P+Q 中 , P 和 Q 是 两 个 相互 独立 的 校 验 值 ， 它 们 的 计算 互 不 影响 ， 都 是 由 同一 条 
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带 上 其 他 数据 磁盘 上 的 数据 依据 不 同 的 算法 计算 而 来 的 。 其 中 了 值 是 通过 同一 条 带 上 除 
P 和 Q 之 外 的 其 他 所 有 数据 盘 上 数据 的 简单 异 或 运算 得 到 。Q 值 的 获得 过 程 就 相对 复杂 
一 些 ， 它 首先 对 同一 条 带 其 他 磁盘 上 的 各 个 数据 分 别 进 行 变 换 ， 然 后 再 将 这 些 变换 结果 
进行 异 或 操作 而 得 到 校 验 盘 上 的 数据 。 这 个 变换 被 称 为 GF 变换 ， 它 是 一 种 常用 的 数学 
变换 方法 ， 可 以 查 GF 变换 表 得 到 相应 的 变换 系数 ， 再 将 各 个 磁盘 上 的 数据 与 变换 系数 
进行 运算 就 得 到 了 GF 变换 后 的 数据 ， 这 个 变换 过 程 是 由 RAID 控制 器 来 完成 的 。 

DP: 两 次 奇偶 校 验 (double parity, DP) 就 是 在 RAID-4 使 用 的 一 个 行 XOR 校 验 磁 
盘 的 基础 上 又 增加 了 一 个 磁盘 用 于 存放 斜 向 的 XOR 校 验 信息 。 

DP 同样 也 有 两 个 相互 独立 的 校 验 信息 块 , 但 是 与 P 十 Q 不 同 的 是 ， 它 的 第 二 块 校 验 
信息 是 斜 向 的 。 横向 校 验 信息 和 和 斜 向 校 验 信息 都 使 用 异 或 校 验 算法 得 到 , 数据 可 靠 性 高 ， 
即使 阵列 中 同时 有 两 个 磁盘 故障 ， 也 仍然 可 以 恢复 出 数据 ， 不 影响 数据 的 使 用 ， 但 是 两 
个 校 验 信息 都 需要 整个 单独 的 磁盘 来 存放 。 

在 图 4-14 F, A, ÆR RAID-5 新 增 的 第 二 个 独立 奇偶 校 验 信息 块 ， 其 他 以 此 
类 推 。 


RAID-6 
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4-14 RAID-6 示意 图 (P+Q) 


RAID-6 的 数据 安全 性 比 RAID-5 高 ， 即 使 阵列 中 有 两 个 磁盘 故障 ， 阵 列 依然 能 够 继 
续 工 作 并 恢复 故障 磁盘 的 数据 。 但 是 控制 器 的 设计 较为 复杂 ， 写 入 速度 不 是 很 高 ， 而 且 
计算 校 验 信 息 和 验证 数据 正确 性 所 花 的 时 间 也 比较 多 ， 当 对 每 个 数据 块 进行 写 操作 时 ， 
都 要 进行 两 次 独立 的 校 验 计算 ， 系 统 负载 较 重 ， 而 且 磁 盘 利用 率 相 对 RAID-5 低 一 些 ， 
配置 也 更 为 复杂 ， 适 合用 在 对 数据 准确 性 和 完整 性 要 求 更 高 的 环境 中 。 


4.2.8 RAID-10 


RAID-10 是 由 RAID-1 与 RAID-0 组 合 而 成 的 RAID 级 别 , 因为 它 先 进行 RAID-1 镜 
像 再 做 RAID-0， 所 以 它 继承 了 RAID-0 的 快速 和 RAID-1 的 安全 。 我 们 知道 ，RAID-1 
在 这 里 负责 阵列 的 元 余 ，RAID-0 则 负责 数据 的 读 写 。 

4-15 很 好 地 诠释 了 RAID-10 的 构成 思想 。 

RAID-10 兼 具 RAID-1 的 高 安全 性 和 RAID-0 的 高 速度 的 优点 ， 但 是 它 需要 至 少 4 
个 磁盘 ， 成 本 较 高 ， 而 且 磁 盘 容 量 利 用 率 也 只 有 50%， 目 前 RAID-10 多 用 于 既 要 求 高 性 
能 ， 又 要 求 高 安全 性 的 金融 、 保 险 、 政 府 和 军队 等 行业 中 。 
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Disk 1 Disk 2 Disk 3 Disk 4 
图 4-15 RAID-10 示意 图 


4.2.9 RAID 级 别 总 结 


如 今 的 RAID 技术 已 经 相当 成 熟 ， 在 各 个 领域 中 都 得 到 了 广泛 的 应 用 ，RAID 的 级 
别 从 RAID 概念 的 提出 ， 已 经 发 展 了 多 个 级 别 ， 其 级 别 分 别 是 0、1、2、3、4、5、6 等 。 
但 是 最 常用 的 是 0、1、5、6、10 四 个 级 别 。 在 不 同 的 应 用 环境 中 ， 根 据 数据 储存 的 要 求 ， 
选择 适当 的 RAID 级 别 ， 已 经 成 为 一 件 必 须 认 真 考虑 的 事情 ， 因 为 只 有 最 合适 的 RAID 
级 别 ， 而 没有 最 好 的 RAID 级 别 ， 这 也 是 为 什么 有 这 么 多 的 RAID 级 别 都 得 到 广泛 运用 
的 原因 。 


4.3 RAID 中 的 数据 保护 技术 


4.3.1 FAS 


当 一 块 磁盘 发 生 故 障 时 ，RAID 组 就 会 进入 降级 状态 ， 如 果 继 续 有 磁盘 故障 ，RAID 
组 就 可 能 进入 失效 状态 ， 导 致 用 户 无 法 对 该 阵列 执行 读 写 操作 。 

当 具 备 数据 见 余 能 力 的 RAID 组 中 的 某 块 磁盘 失效 时 ， 如 果 事 先 配 置 好 了 一 块 备用 
的 磁盘 ， 就 能 够 启动 重 构 ， 把 恢复 的 数据 存储 在 这 块 备用 盘 上 ， 使 其 替代 失效 的 磁盘 ， 
作为 RAID 组 成 员 盘 继续 工作 ， 这 样 的 备用 磁盘 ， 称 为 热 备 盘 。 当 失效 的 磁盘 被 管理 
员 更 换 后 ， 存 储 阵列 会 将 热 备 盘 内 的 数据 拷贝 到 已 经 更 换 的 磁盘 中 ， 热 备 盘 恢复 为 备 
用 状态 。 

热 备 盘 的 工作 模式 主要 分 为 以 下 3 类 。 

(1) Local Spare 特定 热 备 : 针对 某 一 RAID 组 ， 只 有 该 组 硬盘 出 现 问题 后 ， 才 启用 
恢复 。 

(2) Global Spare 全 局 热 备 : 针对 所 有 RAID 组 ， 只 要 某 一 个 RAID 组 出 现 问题 ， 就 
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进行 恢复 。 

(3) Enclosure Spare 机 框 热 备 ， 针 对 盘 柜 ， 只 会 作用 于 该 磁盘 所 在 盘 柜 ， 当 该 磁盘 
所 在 盘 柜 中 的 RIAD 组 故障 才 进 行 恢复 。 

在 具备 数据 见 余 能 力 的 RAID 组 中 ， 根 据 重 构 技 术 ，RAID 组 允许 在 一 个 磁盘 损坏 
的 状态 下 工作 。 存 储 管理 器 可 以 通过 剩余 的 完好 磁盘 计算 出 损坏 磁盘 里 的 内 容 ， 以 供 前 
端 使 用 。 但 是 者 组 内 较 多 的 磁盘 相继 损坏 的 话 ， 则 重 构 技 术 不 能 使 用 。 

采用 热 备 盘 策略 之 后 ，RAID 组 内 损坏 的 第 一 个 磁盘 会 被 热 备 盘 蔡 换 ， 这 样 即使 损 
坏 了 第 二 块 磁盘 ，RAID 组 也 可 以 安全 工作 。 事 实 上 ， 同 一 RAID 组 中 连续 损坏 多 块 磁 
盘 的 概率 微乎其微 ， 因 此 采用 热 备 技术 ， 可 以 使 整个 RAID 组 的 安全 性 大 大 提升 。 


4.3.2 By 


具有 元 余数 据 的 磁盘 阵列 中 的 磁盘 发 生 故 障 时 ， 该 磁盘 上 的 所 有 用 户 数据 或 校 验 数 
据 重 新 生成 的 过 程 ， 或 者 将 这 些 数据 写 到 一 块 或 多 块 备用 磁盘 上 的 过 程 称 为 重 构 
(regenaration)。 重 构 可 以 分 为 镜像 元 余 重 构 与 校 验 元 余 重 构 ， 在 大 多 数 的 阵列 中 ， 应 用 
程序 访问 阵列 的 虚拟 磁盘 上 数据 时 会 引发 重 构 的 过 程 。 

1. 镜像 元 余 重 构 

镜像 元 余 重 构 的 过 程 较为 简单 ， 在 其 中 的 一 块 磁盘 故障 之 后 ， 由 于 备份 盘 上 保存 有 
相同 的 数据 (当然 故障 的 也 有 可 能 是 备份 盘 ), 我 们 可 以 直接 从 存 有 相同 数据 的 磁盘 上 读 
取 我 们 所 需要 的 数据 并 将 数据 写 入 备用 的 磁盘 中 ， 从 而 实现 阵列 的 重 构 。 

由 于 镜像 元 余 的 阵列 的 重 构 仅 仅 是 数据 的 读 取 与 写 入 的 过 程 ， 没 有 涉及 到 数据 的 运 
算 操 作 ， 因 此 重 构 的 过 程 较为 简单 。 

2. RETR EA 

不 同 于 镜像 元 余 ， 校 验 元 余 仅 仅 根据 用 户 的 数据 生成 较 少 的 校 验 数据 ， 因 此 在 磁盘 
出 现 故障 时 的 恢复 能 力 不 如 镜像 元 余 。 校 验 元 余 的 编码 在 4.1 节 中 已 有 前述 ， 校 验 元 余 
的 重 构 是 校 验 见 余 计算 校 验 数据 的 逆 过 程 ， 即 根据 校 验 数据 和 剩余 的 成 员 盘 数据 恢复 出 
故障 磁盘 上 的 数据 (当然 故障 的 也 可 能 是 存放 校 验 数据 的 磁盘 或 者 同时 存放 了 用 户 数 据 
和 校 验 数据 的 磁盘 ， 此 时 的 重 构 过 程 包含 了 部 分 校 验 数 据 生 成 的 过 程 )。 

使 用 海 明 码 生成 校 验 数 据 的 阵列 ， 可 以 进行 简单 的 道 运算 来 恢复 。 例 如 ， 海 明码 为 
101000110111， 其 中 第 3 位 由 于 磁盘 故障 而 丢失 了 数据 ， 变 为 了 10_000110111， 由 于 第 
1 位 是 第 3、5、7、9、11 位 的 异 或 运算 的 结果 ， 所 以 只 需要 将 第 1、5、7、9、11 位 寞 
或 便 可 以 知道 第 3 位 为 1。 其 他 位 数据 的 缺失 可 以 根据 类 似 的 方法 恢复 。 

使 用 XOR 算法 生成 校 验 数据 阵列 的 重 构 ， 以 RAID-5 为 例 ， 当 一 个 磁盘 故障 后 ， 可 
以 从 剩余 的 所 有 磁盘 中 读 取 数据 并 恢复 出 故障 磁盘 中 的 数据 ， 由 于 校 验 数据 是 用 户 数据 
的 异 或 结果 ， 因 此 根据 异 或 运算 的 法 则 和 规律 ， 将 剩余 的 数据 异 或 便 可 以 得 到 丢失 的 数 
据 ， 从 而 进行 恢复 。 

总 的 来 说 ， 比 起 镜像 元 余 ， 校 验 元 余 由 于 拥有 较 少 的 元 余数 据 而 使 得 上 自身 的 重 构 
能 力 较 弱 ， 当 较 多 的 磁盘 故障 时 ， 如 RAID-5 中 超过 一 块 磁盘 故障 ， 则 无 法 重 构 ， 
而 且 由 于 需要 进行 额外 的 计算 来 获得 丢失 的 数据 , 所 以 重 构 的 过 程 较 之 镜像 元 余 更 加 
复杂 。 


第 4 章 RAID 技术 及 应 用 | 85 


4.3.3 YSN 


HH Vl (redundant copy) 是 磁盘 目 我 诊断 的 一 项 功能 ， 在 存储 系统 中 所 有 的 故障 都 
自动 报告 。 磁 盘 中 的 数据 在 磁盘 出 现 故障 预警 时 自动 拷贝 到 热 备 盘 中 ， 当 拷贝 完成 时 ， 
故障 磁盘 被 隔离 ， 热 备 盘 替换 原 磁盘 加 入 RAID 组 中 ， 如 图 4-16 所 示 。 







将 数据 拷贝 
进 热 备 盘 中 


热 备 盘 






故障 预警 


出 现 故障 预警 的 磁盘 被 隔离 ， 同 时 将 热 
备 盘 替代 此 磁盘 加 入 RAID 组 断 续 工 作 


K 4-16 预 拷 贝 示意 图 


通过 磁盘 预 拷贝 功能 ， 提 供 可 靠 的 不 停机 操作 ， 保 护 了 数据 ， 另 外 一 定 意义 上 减少 
了 重 构 操 作 ， 提 高 了 RAID 组 的 使 用 效率 。 


4.4 RAID 5 LUN 


在 存储 系统 中 ， 多 个 硬盘 可 以 组 成 一 个 RAID 4A, —7 RAID 组 的 空间 在 存储 控制 
器 中 是 以 物理 卷 的 形式 存在 的 。 存 储 控制 器 者 要 把 存储 空间 给 前 端的 服务 器 使 用 ， 还 需 
要 将 物理 卷 划分 为 逻辑 卷 ， 并 通过 逻辑 单元 号 Clogic unit number, LUN) 来 区 分 。 应 用 
系统 实际 应 用 的 存储 空间 是 对 逻辑 卷 来 进行 操作 的 。 由 物理 卷 创建 多 个 逻辑 卷 ,如 图 4-17 
所 示 。 
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逻辑 着 






Z 


物理 磁盘 2 物理 磁盘 3 






物理 磁盘 | 
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PH I 


图 4-17 物理 卷 创建 多 个 逻辑 卷 





















45 ” 云 计 算 和 大 数据 时 代 RAID 的 发 展 趋势 


45.1 云 计 算 和 大 数据 时 代 RAID 面临 的 问题 


如 今 已 进入 大 数据 时 代 ， 而 RAID 是 各 大 数据 中 心经 常 采 用 的 一 种 存储 方式 。 在 实 
践 中 ， 现 有 的 RAID 方式 呈现 出 了 诸多 的 不 足 。 

。 可 靠 性 : 随 着 数据 规模 的 扩大 ， 故 障 发 生 的 几率 也 会 提高 ， 使 得 人 们 对 存储 方式 
BY Se CE AY the NIE VY) 

。 性 能 : 在 数据 流量 迅速 增加 的 现在 ， 阵 列 性 能 已 成 为 限制 数据 流通 的 一 大 因素 。 
性 能 包括 很 多 方面 ， 除 了 磁盘 阵列 的 读 写 性 能 之 外 ，RAID 阵列 的 恢复 性 能 也 十 
分 重要 。 

。 可 扩展 性 : 即 在 RAID 阵列 中 增 减 磁盘 时 ， 通 过 尽 可 能 少 的 移动 数据 来 维持 读 写 
性 能 的 能 力 。 为 了 满足 如 今 云 计 算 时 代 越 来 越 多 在 线 应 用 的 需求 ，RAID 阵列 也 
需要 具备 较 好 的 可 扩展 性 。 

在 上 述 的 3 个 方面 中 ， 同 时 追求 可 靠 性 和 性 能 似乎 是 矛盾 的 。 同 等 条 件 下 ， 性 能 最 
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好 的 RAID-0 完全 不 具备 容错 能 力 。 而 为 了 追求 容错 能 力 ，RAID-5、RAID-6 计算 校 验 
的 过 程 中 不 仅 使 用 了 更 多 的 磁盘 空间 ， 而 且 御 牲 了 写 性 能 。 因 此 在 实际 应 用 中 ， 从 RAID 
的 可 靠 性 和 性 能 中 找到 一 个 合适 的 平衡 点 ， 也 是 十 分 重要 的 。 


45.2 ” 云 计 算 和 大 数据 时 代 RAID 发 展 的 实践 


RAID-5 作为 一 种 单 盘 容错 方法 ， 当 一 个 盘 发 生 故 障 时 ， 可 以 通过 其 他 盘 来 恢复 。 
但 是 ， 者 同时 有 两 个 盘 失 效 ， 或 者 在 恢复 过 程 中 发 生 故 障 ， 则 整个 阵列 中 的 数据 都 会 失 
效 。RAID-6 采用 了 纠 删 码 ， 能 够 双 盘 容错 ， 大 大 提升 了 磁盘 的 安全 性 。 现 如 今 ， 能 够 
多 盘 容 错 的 RAID 也 被 纷纷 使 用 到 了 存储 领域 。 

一 种 实现 多 盘 容 错 RAID 阵列 使 用 Reed-Solomon (RS) 编码。 在 4.2.7 小 节 中 介绍 了 
基于 RS 编码 的 PHO 是 实现 RAID-6 的 一 种 方式 。 事 实 上 ，RS 编码 也 可 以 实现 多 盘 容 错 。 

RS 码 的 生成 矩阵 如 图 4-18 所 示 ， 可 以 看 出 ， 调 整 参 数 即 可 生成 不 同 的 RS 编码 。 

这 个 方法 的 优点 是 对 于 任意 规模 ，RS 码 都 可 以 保证 其 正确 性 。 另 外 ,在 RS 码 的 编 
码 过 程 中 只 采用 了 水 平 校 验 ， 它 也 具有 比较 优越 的 恢复 性 能 和 扩展 性 。 

RS 码 的 缺点 在 于 其 中 使 用 的 伽 罗 瓦 域 运算 速度 较 慢 ,限制 了 它 的 性 能 。 比 起 其 他 的 
纠 删 码 ， 如 RDP、X-Code 来 说 ， 同 等 条 件 下 它 的 性 能 更 差 。 

除了 多 盘 容 错 外 ， 有 些 学 者 正 试 图 寻找 新 的 发 展 方向 。 例 如 ，2013 年 提出 的 SD 编 
码 ， 可 以 容忍 了 个 磁盘 和 另外 任意 8 个 块 发 生 错误 ， 如 图 4-19 所 示 。 这 是 一 种 全 新 的 解 
决 多 个 数据 块 同时 失效 问题 的 方案 。 


m=4 





s=2 s=] 


图 4-18 RS 码 的 生成 矩阵 图 4-19 SD 编码 


46 BABA 


完成 本 章 的 学 习 ， 将 能 够 : 

。 了 解 磁盘 阵列 的 产生 背景 。 

。 掌握 磁盘 阵列 的 工作 原理 和 分 类 。 

。 掌握 RAID 的 基础 概念 和 常见 RAID 级 别 。 
。 熟悉 常用 RAID 的 特征 和 应 用 场景 。 
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。 了 解 大 数据 时 代 RAID 未 来 发 展 趋势 。 
本 章 从 RAID 的 基本 概念 与 技术 原理 、RAID 级 别 、RAID 中 的 数据 保护 技术 、RAID 


与 LUN 以 及 云 计算 和 大 数据 时 代 RAID 的 发 展 趋势 几 个 方面 对 RAID 技术 及 应 用 进行 了 
介绍 。 


读者 需要 掌握 RAID 的 基本 概念 与 技术 原理 包括 : 

e RAID 的 分 类 : JBOD、SBOD 等 。 

。 RAID 的 数据 组 织 、 存 取 和 了 宛 余 方式 等 。 对 于 几 种 常见 的 数据 宛 余 方式 ， 如 镜像 
隐 余 、 奇 偶 校 验 码 以 及 海 明 码 ， 要 掌握 其 原理 。 

e RAID 各 项 级 别 的 特点 、 优 劣 以 及 适用 范围 。 对 于 常用 的 RAID 级 别 ( 如 RAID-0、 
RAID-1、RAID-5、RAID-6、RAID-10 等 ) 要 求 较为 深入 地 掌握 相关 的 知识 。 

。 RAID 中 的 数据 保护 技术 ， 对 于 热 备 、 重 构 和 预 拷 贝 等 ， 要 熟悉 其 定义 、 操 作 过 
程 等 。 

e 了 解 RAID、LUN 以 及 RAID 未 来 的 发 展 趋势 。 


47 练习 题 

一 、 选 择 题 
1. 常见 磁盘 阵列 的 分 类 包括 C Ye 

A. JBOD B. SBOD C. MAID D. RAID 
答案 (ABD) 
2. 不 具备 数据 元 余 保 护 能 力 的 RAID 级 别 是 ( )。 

A. RAID-10 B. RAID-50 C. RAID-3 D. RAID-0 
答案 (D) 
3. 在 单个 阵列 盘 区 中 ， 一 系列 连续 编 址 的 磁盘 块 的 集合 称 为 〈 Ja 

A. 磁盘 阵列 B. RAID C. 条 带 D. 数据 块 
答案 (D) 
4. 磁盘 阵列 中 映射 给 主机 使 用 的 存储 空间 称 为 C ia 

A. LUN B. RAID C. 磁盘 D. 磁盘 阵列 
答案 (A) 
5. 镜像 阵列 或 者 RAID 阵列 中 发 生 故 障 的 磁盘 上 的 所 有 用 户 数据 和 校 验 数据 的 重新 

生成 过 程 称 为 ( iz 

A. 重 计算 B. BY C. ASH D. 恢复 
答案 (B) 
6. 相同 条 件 下 ， 以 下 具备 最 佳 读 取 性 能 的 RAID 级 别 是 

A. RAID-1 B. RAID-3 C. RAID-0 D. RAID-5 
答案 (A) 


7. 以 下 不 是 采用 奇偶 校 验 作为 数据 元 余 方 式 的 RAID RAH ( Do 
A. RAID-2 B. RAID-3 C. RAID-4 D. RAID-5 
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答案 (A) 

8. 在 同一 RAID 组 中 最 多 允许 两 块 磁盘 同时 失效 的 RAID RHE ( Js 
A. RAID-2 B. RAID-6 C. RAID-5 D. RAID-4 

答案 (B) 


9. 在 相同 磁盘 数量 情况 下 ， 以 下 所 能 够 提供 的 存储 空间 最 少 的 RAID 级 别 是 
( )。 
A. RAID-5 B. RAID-50 C. RAID-1 D. RAID-3 


ER (C) 
10. {+ E-mail 或 者 是 DB 应 用 ,以 下 ( ) 级 别 是 不 被 推荐 的 。 
A. RAID-10 B. RAID-50 C. RAID-5 D. RAID-0 
答案 (D) 
ll. 不 考虑 缓存 ， 如 果 将 一 个 数据 块 写 入 一 个 RAID-6 的 阵列 中 ， 需 要 ( ) 次 
写 操作 。 
A. 1 ae pe C. 3 D. 4 
ZR (C) 
二 、 简 答题 


1. RAID-6 有 哪 两 种 常见 的 实现 方式 ， 它 们 各 有 什么 优 劣 ? 
2. 从 RAID-5 到 RAID-6 实现 的 变化 ， 设 计 一 种 能 够 容纳 任意 3 块 磁盘 失效 的 
RAID. 


5.1 
2.2 
5.3 
5.4 
2.5 
5.6 





存储 阵列 系统 的 组 成 
存储 阵列 系统 架构 简 析 
存储 阵列 通用 技术 

华为 存储 阵列 产品 及 应 用 
本 章 总 结 

练习 题 








存储 阵列 技术 伴随 着 信息 快速 增长 融 来 的 数据 爆炸 而 出 现 。 在 现代 IT 系 统 不 断 升 级 的 今 
天 ， 数 据 存储 需求 也 在 爆炸 性 增长 ， 存 储 阵 列 设备 已 然 成 为 了 IT 系 统 的 核心 组 成 部 分 之 一 。 
本 章 将 从 存储 阵列 系统 的 硬件 组 成 出 发 ， 进 而 引出 一 系列 存储 阵列 通用 技术 ， 最 后 介绍 华为 
存储 系统 及 其 应 用 。 


关于 本 章 
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5.1 存储 阵列 系统 的 组 成 


存储 阵列 将 多 个 磁盘 组 成 一 个 逻辑 上 更 大 的 磁盘 ， 当 作 单 一 的 磁盘 存储 资源 来 使 
用 。 而 如 何 组 织 、 协 调 多 个 磁盘 ， 并 降低 管理 的 复杂 度 ， 则 是 存储 阵列 技术 的 核心 所 在 。 
为 了 达成 这 一 系列 的 目标 ， 优 秀 的 硬件 染 构 是 不 可 或 缺 的 。 下 面 将 以 华为 Oceanstor V3 
系列 存储 系统 为 例 ， 介 绍 存 储 阵列 系统 的 硬件 组 成 。 


5.2 存储 阵列 系统 染 构 简 析 


在 外 形 上 ， 和 存储 包括 控制 框 和 硬盘 框 两 大 部 分 。 控 制 框 与 硬盘 框 两 者 的 有 机 结合 共 
同 为 用 户 提供 一 个 高 可 靠 、 高 性 能 、 大 容量 的 智能 化 存储 空间 。 这 两 者 同时 也 有 着 明确 
的 分 工 ， 表 5-1 简要 描述 了 它们 各 目的 功能 。 


表 5-1 硬件 组 成 和 功能 描述 
控制 框 提供 存储 接 入 、 数 据 配置 等 系统 管理 功能 ， 以 及 备份 、 数 据 共享 、 数 据 快 照 等 
数据 安全 管理 功能 
硬盘 框 提供 充足 的 存储 空间 


华为 OceanStor V3 系列 存储 系统 如 图 5-1 所 示 。 





图 5-1 46 OceanStor V3 系列 存储 系统 


5.2.1 ”控制 框 


控制 框 提供 存储 接 入 、 数 据 配 置 等 系统 管理 功能 ， 还 可 提供 备份 、 数 据 共享 、 数 据 
快照 等 数据 安全 管理 功能 。 控制 框 采用 部 件 模块 化 设计 ， 主 要 由 系统 插 杠 、 控 制 器 模块 、 
BBU (backup battery unit) 模块 、 风 扁 模 块 、 电 源 模块 、 接 口 模块 和 硬盘 模块 组 成 。 根 
据 控 制 框 内 部 模块 的 组 织 方 式 ， 可 将 控制 框 分 为 盘 控 一 体 与 盘 控 分 离 两 类 。 例 如 ，5500 V3 
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采用 盘 控 一 体 架 构 ( 见 图 5-2)， 而 5600 V3 采用 盘 控 分 离 架构 〈 见 图 5-3)。 两 种 设计 的 
主要 区 别 在 于 盘 控 分 离 架构 中 除去 了 硬盘 模块 ， 盘 控 一 体 架 构 则 包含 硬盘 模块 ， 同 时 将 
盘 控 分 离 架 构 中 的 一 些 独立 模块 进行 融合 ， 如 将 BBU 模块 与 风扇 模块 结合 为 风扇 -BBU 
模块 ， 将 接口 模块 融入 控制 器 模块 等 。 这 两 种 架构 的 不 同 主要 来 源 于 用 户 的 需求 不 同 。 
以 5500 V3 与 5600 V3 为 例 ， 表 5-2 列举 了 它们 的 部 分 区 别 。 





5-2 5500 V3 控制 框 整体 结构 图 


电源 模块 “重信 





图 5-3 5600 V3 控制 框 整体 结构 图 
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表 5-2 5500 V3 与 5600 V3 的 比较 


最 大 级 联 硬 盘 杠 数 40 个 
最 大 硬盘 数 1000 个 


12 个 8Gbit/s FC 主机 端口 28 个 8Gbits FC 主机 端口 

4 个 16Gbits FC 接口 模块 14 个 16Gbits FC 接口 模块 
8 个 10Gbit/s TOE 主机 端口 28 个 10Gbit/s TOE 主机 端口 
8 个 10Gbit/s FCoE 主机 端口 28 个 10Gbit/s FCoE 主机 端口 
8 个 1Gbit/s iSCSI 主机 端口 28 个 1Gbits iSCSI 主机 端口 


— - 
级 联 端口 (每 控制 器 ) | T 12Gbrt/s poem attached SCSI) | 23 个 12Gbits 的 SAS 级 联 模块 


可 以 看 出 5600 V3 支持 更 多 的 端口 ， 同 时 承担 着 更 大 数量 的 硬盘 管理 任务 ， 这 要 求 它 
将 模块 分 离 以 提供 更 专 一 、 更 强大 的 管理 功能 ， 这 也 要 求 它 将 硬盘 模块 从 控制 框 中 移 除 ， 以 
腾 出 更 大 的 空间 给 增多 的 模块 。 下 面 将 按 5600 V3 的 架构 逐一 介绍 组 成 控制 框 的 各 个 模块 。 

l. 系统 插 框 

系统 插 框 通过 背 板 为 各 种 接口 模块 提供 可 靠 的 连接 ， 实 现 各 个 模块 之 间 的 信号 互 连 
与 电源 互 连 。 系 统 插 框 硬 件 结构 灵活 ， 通 过 插入 不 同 的 接口 模块 可 以 满足 不 同 的 接口 和 
业务 需求 。 

3U 系统 插 框 的 外 观 如 图 5-4 所 示 。 


2. 控制 器 模块 
控制 器 是 控制 框 中 的 核心 部 件 ， 主 要 负责 处 理 存储 业务 、 接 收 用 户 的 配置 管理 命令 


并 保存 配置 信息 、 接 入 便 盘 和 保存 关键 信息 到 保险 箱 硬盘 。 
控制 器 外 观 如 图 5-5 所 示 。 


PE PE 






最 大 主机 端口 数 
(每 控制 器 ) 









5-4 系统 插 框 外 观 5-5 ”控制 器 外 观 
3. 接口 模块 
接口 模块 包括 管理 模块 、FC 接口 模块 、iSCSI 接口 模块 、SAS 级 联 模块 和 FCoE 接 
口 模块 。 
(1) FC 接口 模块 


FC 接口 模块 提供 了 应 用 服务 器 与 存储 系统 的 业务 接口 ,用 于 接收 应 用 服务 器 发 出 的 
数据 IO 命令 和 数据 流 ; 男 外 ，FC 硬盘 框 还 提供 了 连接 控制 框 与 硬盘 框 的 级 联 口 ， 用 于 
与 后 端 便 盘 框 进行 交互 。FC 接口 模块 提供 传输 速率 为 8Gbit/s 或 16Gbit/s 的 主机 端口 。 
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当 问 口 速率 设置 为 自 适应 且 连 接 的 设备 传输 速率 低 于 端口 速率 时 ， 端 口 将 自动 适应 传输 
速率 ， 以 保证 数据 传输 通道 的 连通 性 和 数据 传输 速率 的 一 致 性 。 当 手动 设置 速率 时 ， 如 
果 速 率 不 一 致 ， 则 会 导致 连接 中 断 。 

8Gb FC 接口 模块 外 观 如 图 5-6 所 示 。 


模块 电源 指示 灯 / RIA 
模块 拉手 


8Gb FC 端口 


8Gb FC 端口 link/speed 指示 灯 





5-6 8Gb FC 接口 模块 外 观 


(2) iSCSI 接口 模块 

GE 电 接 口 模块 提供 了 应 用 服务 器 与 存储 系统 的 业务 接口 ， 用 于 接收 应 用 服务 器 发 
出 的 数据 读 写 指令 和 数据 流 。GE 电 接 口 模块 提供 4 个 传输 速率 为 1Gbit/s 的 iSCSI 接口 ， 
用 于 接收 应 用 服务 器 发 出 的 数据 交换 命令 。 

GE 电 接 口 模块 的 外 观 如 图 5-7 所 示 。 


模块 电源 指示 灯 / 热 拔 插 按钮 模块 拉手 


GE HW O GE 电 端 口 speed 指示 灯 


GE 电 端 口 link/active 指示 灯 





图 5-7 GE 电 接 口 模块 外 观 
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10Gb TOE 接口 模块 提供 了 4 个 传输 速率 为 10Gbit/s 的 iSCSI HO, 作为 应 用 服务 器 

与 存储 系统 的 业务 接口 ， 用 于 接收 应 用 服务 器 发 出 的 数据 读 写 指令 ， 以 及 应 用 服务 器 和 
存储 系统 之 间 的 数据 传输 。 

10Gb TOE 接口 模块 的 外 观 如 图 5-8 所 示 。 

模块 电源 指示 灯 / 热 插 拔 按钮 kait 


10Gb TOE 端口 


10Gb TOE 端口 link/speed 指示 灯 





5-8 10Gb TOE 接口 模块 外 观 


(3) SAS 级 联 模块 

SAS 级 联 模块 提供 4 个 传输 速率 为 12Gbit/s 的 mini SAS 级 联 端 口 ,用 于 级 联 硬盘 框 。 
SAS 级 联 模块 通过 mini SAS 电缆 与 存储 系统 的 后 端 硬盘 阵列 连接 。 当 连接 的 设备 传输 速 
率 低 于 级 联 端 口 速率 时 ， 级 联 端 口 将 自动 适应 传输 速率 ， 以 保证 数据 传输 通道 的 连通 性 
和 数据 传输 速率 的 一 致 性 。 

SAS 级 联 模块 外 观 如 图 5-9 所 示 。 


模块 电源 指示 灯 / 热 拔 插 按 钮 
模块 拉手 


mini SAS HD 级 联 端 口 


mini SAS HD 级 联 端口 指示 灯 





图 5-9 SAS 级 联 模块 外 观 


(4) 管理 模块 
管理 模块 为 存储 系统 提供 管理 接口 ， 主 要 包括 管理 网 口 和 串口 。 管 理 模块 将 系统 配 
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置 数据 、 告 警 信息 以 及 日 志 信息 保存 到 管理 模块 的 指定 存储 介质 上 。 
管理 模块 的 外 观 如 图 5-10 所 示 。 

管理 模块 拉手 

管理 模块 电源 指示 灯 


USB 端口 


管理 网 口 speed 指示 灯 
管理 网 口 
管理 网 口 link/active 指示 灯 


维护 网 口 





图 5-10 管理 模块 外 观 


4. BBU 模块 

BBU 能 够 在 系统 外 部 供电 失效 的 情况 下 ， 提 供 后 备 电源 支持 ， 以 保证 存储 阵列 缓存 
中 业务 数据 的 安全 性 。 在 系统 电源 输出 正常 时 处 于 备份 状态 ， 当 外 部 电源 断 开 时 ，BBU 
能 够 继续 给 系统 供电 。BBU 支持 失效 隔离 ， 当 BBU 出 故障 时 不 会 影响 系统 的 正常 运行 。 

BBU 的 外 观 如 图 5-11 所 示 。 


BBU 模块 拉手 
BBU 模块 卡 扣 
BBU 模块 运行 /告警 指示 灯 





图 5-11 BBU 外 观 


5. 电源 模块 
控制 框 配 置 了 多 个 电源 模块 形成 见 余 ， 其 中 任 一 电源 模块 故障 都 不 会 影响 控制 框 的 
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正常 工作 ， 保 证 了 电源 模块 的 高 可 靠 性 ， 同 时 ， 多 个 电源 模块 可 以 支持 控制 框 在 最 大 功 
耗 下 的 正常 运行 。 
交流 电源 模块 外 观 如 图 5-12 所 示 。 





电源 模块 运行 / 告警 指示 灯 


电源 模块 拉手 


| 
Sa iit) 
apg Í 
i; 


扎 线 扣 电源 模块 插座 
图 5-12 交流 电源 模块 外 观 


6. Bl aa BRR 

风扇 模块 为 系统 提供 散热 功能 , 可 以 支持 控制 框 在 
最 大 功 耗 模式 下 的 正常 运行 。 每 个 风扇 模块 支持 热 插 拔 
功能 。 控 制 框 配置 了 多 个 风扇 模块 ， 每 个 风扇 模块 又 会 
内 置 多 个 小 风扇 ， 为 控制 框 提供 元 余 备 份 的 散热 功能 ， 
其 中 任意 一 个 风扇 出 现 故障 , 都 不 会 影响 控制 框 的 正常 
工作 。 风 扇 模 块 支 持 多 级 智能 调 速 ， 控 制 器 能 够 根据 系 
统 温 度 信 息 ， 综 合 判断 风扇 转速 ， 智 能 调节 风速 ， 从 而 
在 保证 散热 效果 的 同时 ， 最 大 限度 地 节能 。 

控制 框 的 风扇 模块 如 图 5-13 所 示 。 5-13 PARRIN 


5.2.2 ”硬盘 框 


硬盘 框 为 存储 系统 提供 了 充足 的 存储 空间 。 硬 盘 框 采 用 部 件 模块 化 设计 ， 主 要 由 系 
统 插 框 、 电 源 模块 、 风 扇 模块 、 级 联 模块 和 硬盘 模块 组 成 。 按 照 结构 划分 ， 硬 盘 框 可 以 
分 为 2U 硬盘 框 和 4U 硬盘 框 。 其 中 ，2U 硬盘 框 使 用 2.5 英寸 硬盘 〈 见 图 5-14), 4U fe 
盘 框 使 用 3.5 英寸 硬盘 〈 见 图 5-15)。 将 存储 控制 框 中 控制 器 的 SAS 接口 通过 SAS 级 联 
电缆 连接 到 硬盘 框 的 SAS 接口 , 可 将 控制 框 中 的 多 个 硬盘 和 硬盘 框 中 的 多 个 硬盘 串 接 起 
来 形成 一 个 Loop. 而 在 单一 硬盘 框 不 能 满足 存储 资源 空间 需求 的 应 用 场合 , 还 可 以 通过 
级 联 多 个 硬盘 框 的 级 联 端 口 ， 将 多 个 硬盘 框 中 的 硬盘 连接 到 同一 个 Loop 中 ， 以 整体 提 
升 磁盘 阵列 的 存储 容量 。 
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硬盘 模块 
运行 指示 灯 
硬盘 模块 告警 / 

定位 指示 灯 


硬盘 模块 卡 扣 


硬盘 模块 拉手 


硬盘 模块 标签 
5-14 2.5 英寸 硬盘 模块 外 观 


硬盘 


硬盘 模块 拉手 





硬盘 模块 运行 指示 灯 
硬盘 模块 卡 扣 硬盘 模块 告警 /定位 指示 灯 


5-15 3.5 英寸 硬盘 模块 外 观 


下 面 通过 介绍 4U 硬盘 框 来 详细 了 解 硬 盘 框 的 组 成 。 

1. 4U 硬盘 框 整体 简 析 

在 逐一 介绍 各 模块 之 前 ， 先 了 解 S5600T 的 4U 硬盘 框 的 整体 结构 、 工 作 原 理 、 信 号 
流 和 面板 ， 为 了 解 其 各 模块 做 好 准备 。 

硬盘 框 的 整体 结构 如 图 5-16 所 示 。 
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图 5-16 4U 硬盘 框 结构 


硬盘 框 前 视图 如 图 5-17 所 示 。 


3.5 英寸 硬盘 硬盘 框 ID 
硬盘 模块 拉手 模块 卡 扣 显示 器 





5-17 4U 硬盘 框 前 视图 


硬盘 框 后 视图 如 图 5-18 所 示 。 


风扇 模 
块 卡 扣 








mini 


电源 ”级 联 模 串口 ”SAS HD 硬盘 框 级 联 电源 模 电源 
插座 HF 级 联 端 口 ID 模块 块 卡 扣 模块 
“PRI” 显示 器 电源 模 
mini SAS HD 块 拉手 
级 联 端 口 “EXP” 


K 5-18 配置 交流 电源 模块 的 4U 硬盘 框 后 视图 
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2. 系统 插 框 

系统 插 框 通过 插入 不 同 的 部 件 实现 硬件 的 灵活 配置 。 系 统 插 框 的 主要 功能 是 实现 各 
个 模块 之 间 的 信号 互 连 与 电源 互 连 。 系 统 插 框 的 外 观 如 图 5-19 所 示 。 

3. 级 联 模块 

级 联 模块 通过 级 联 端 口 来 级 联 控制 框 或 硬盘 框 ， 实 现 与 控制 框 或 硬盘 框 的 通信 ， 是 
控制 框 和 硬盘 框 之 间 进 行 数 据 传输 的 连接 点 。 每 个 级 联 模块 提供 一 个 PRI 级 联 端口 和 一 
个 EXP 级 联 端 口 ， 一 个 硬盘 框 的 PRI 级 联 端口 可 以 和 男 一 人 硬盘 框 的 EXP 级 联 端口 间 
级 联 。 

级 联 模块 的 外 观 如 图 5-20 所 示 。 





图 5-19 ”系统 插 框 外 观 图 5-20 ”级 联 模块 外 观 


5.3 存储 阵列 通用 技术 


在 存储 阵列 系统 的 发 展 过 程 中 ， 产 生 了 很 多 被 广泛 应 用 的 存储 阵列 技术 。 其 中 ， 具 
有 代表 性 的 是 磁盘 预 拷 贝 、LUN 拷贝 、 块 虚拟 化 、SmartTimer、SmartQoS、Smart Thin, 
操作 分 级 、 硬 件 元 余 、 掉 电 保 护 、 人 保险箱、 镜像 通道 、 热 插 拔 、SSD 缓存 、 多 路 径 、 流 
量 控 制 和 SAS 级 联 等 。 这 些 技术 分 别 从 可 靠 性 、 性 能 、 可 扩展 性 、 易 管理 4 方面 为 存储 
阵列 的 发 展 做 出 贡献 。 这 些 技术 的 分 类 如 表 5-3 所 示 。 


表 5-3 存储 阵列 通用 技术 分 类 
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( 续 表 ) 
NR | EES E 
| 
ER Cas 
RY wr A 
me | fee 
本 
| 


5.3.1 BMS] 


磁盘 预 拷贝 技术 是 指 ， 系 统 实 时 从 磁盘 的 SMART 信息 中 读 取 磁 盘 的 状态 信息 ， 当 
发 现 磁 盘 错 误 统 计 超 过 设 定 浆 值 后 ， 立 即 局 动 ， 将 数据 从 疑似 故障 盘 中 迁移 到 热 备 盘 ， 
同时 向 管理 人 员 告 警 ， 提 醒 更 换 疑 似 故障 盘 。 这 样 可 以 大 大 降低 重 构 事件 发 生 的 概率 ， 
提高 系统 的 可 靠 性 。 

磁盘 预 拷贝 技术 可 以 充分 利用 从 检测 到 即将 失效 到 磁盘 真正 失效 这 段 时间 来 降低 
风险 ， 与 数据 重 构 技 术 相 比 ， 磁 盘 预 拷贝 技术 具备 以 下 优势 。 

(1) 低 风 险 : 在 整个 预 拷贝 过 程 中 ，RAID 组 处 于 正常 状态 ， 所 有 成 员 盘 均 处 于 可 
用 状态 ，RAID 组 的 数据 见 余 信息 是 完整 的 ， 客 户 数据 无 丢失 风险 。 而 在 重 构 过 程 中 ， 
RAID 组 处 于 降级 状态 ，RAID 组 的 数据 元 余 信 息 不 完整 《或 已 丢失 )， 客 户 数据 处 于 高 

(2) 高 效率 : 重 构 过 程 中 要 涉及 RAID 中 的 多 个 盘 ， 速 度 较 低 ， 而 且 占 用 后 端 带宽 
也 较 大 。 而 磁盘 预 拷 贝 技术 只 是 两 个 硬盘 之 间 的 数据 拷贝 ， 速 度 快 ， 占 用 资源 少 〈《 和 重 
构 相 比 )。 


5.3.2 LUN 拷贝 


LUN 拷贝 是 一 种 基于 块 的 将 源 LUN 的 数据 复制 到 目标 LUN 的 技术 。 它 的 特点 
如 下 。 

(1) 将 数据 从 本 存储 系统 复制 到 一 个 或 多 个 其 他 存储 系统 。 

(2) 将 数据 从 一 个 或 多 个 其 他 存储 系统 复制 到 本 存储 系统 。 

(3) 将 数据 从 本 存储 系统 中 的 一 个 LUN 复制 到 另 一 个 LUN。 

LUN 拷贝 一 般 用 于 实现 分 级 存储 、 系 统 升 级 、 异 地 备份 等 。 

LUN 拷贝 的 优势 如 下 。 

(1) 高 性 能 。 LUN 拷贝 的 实现 过 程 比 基 于 主机 拷贝 的 实现 过 程 更 加 简洁 , 因此 LUN 
拷贝 的 性 能 将 大 大 高 于 基于 主机 的 拷贝 。 

(2) 业务 无 关 性 。 在 LUN 拷贝 的 执行 过 程 中 ， 不 需要 主机 参与 ， 不 会 占用 主机 的 
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资源 。 主 机 可 以 将 更 多 的 资源 用 于 处 理 生 产业 务 。 

(3) 高 兼容 性 。 LUN 拷贝 能 够 在 异 构 环 境 下 部 署 , 支持 不 同 品牌 存储 系统 间 的 LUN 
拷贝 。 

LUN 拷贝 支持 全 量 和 增 量 两 种 拷贝 模式 。 


5.3.3” 块 虚拟 化 


块 虚拟 化 是 一 种 新 型 RAID 技术 。 将 硬盘 划分 成 若干 固定 大 小 的 块 〈(chunk)， 然 后 
将 其 组 合成 小 RAID 组 (CKG)， 如 图 5-21 所 示 。RAID 的 组 成 不 再 以 硬盘 为 单位 ， 而 





以 chunk 为 单位 。 
om [ose] [eae] Lee] Cee] Coe) | [eee] Cee) Cees) Dee] 
ee O as [aS [a 
a SS FS ee es Eo eee i a 2 WE Ae ， 
| Extent | Extent | Extent | Extent | [Extent | Extent | Extent | Extent | CKG 










4 e 4 ò 


—S— Sl SRS 
ex] [ex] Lex] | Lex} [ex] [ex] | lex] Lex] [ex] | Lox] [ex] [ex] isk 
图 5-21 块 虚拟 化 技术 





块 虚拟 化 技术 的 特点 如 下 。 

(1) 将 数据 分 布 到 系统 中 的 所 有 硬盘， 充分 发 挥 系 统 的 读 写 处 理 能 力 。 

(2) 某 一 硬盘 失效 时 ， 存 储 池 内 的 其 他 人 硬盘 都 会 参与 重 构 ， 消 除 传 统 RAID FHE 
构 性 能 瓶颈 ， 提 高 重 构 数 据 的 速度 。 

(3) 存储 系统 按照 用 户 设置 的 “数据 迁移 粒度 ”将 CKG Lat AE) extent, AF 
extent 组 成 了 用 户 需 要 使 用 的 LUN。 在 存储 系统 中 申请 空间 、 释 放空 间 、 和 迁移 数据 都 是 
以 extent 为 单位 进行 的 。 


5.3.4 SmartTier 


存储 系统 支持 的 存储 介质 包括 : SSD (solid state drive) 硬盘 、SAS (serial attached 
SCSI) 硬盘 、NL (near line) SAS 硬盘 。 

不 同 存储 介质 在 存储 成 本 和 存储 性 能 方面 的 差异 很 大 ， 这 导致 用 户 难 以 在 存储 成 本 
和 存储 性 能 之 间 权 衡 。SSD 硬盘 的 响应 时 间 很 短 ， 每 单位 存储 请 求 处 理 成 本 很 低 ， 但 每 
单位 存储 容量 成 本 很 高 。NL SAS 硬盘 每 单位 存储 容量 成 本 较 低 ， 但 啊 应 时 间 很 长 ， 且 
每 单位 存储 请 求 处 理 成 本 很 高 。SAS 硬盘 介 于 以 上 两 者 之 间 。 

SmartTier 进行 LUN 级 别 的 智能 化 数据 存放 管理 。SmartTier 统计 和 分 析 数 据 的 活跃 
度 ， 将 不 同 活跃 度 的 数据 和 不 同 特点 的 存储 介质 动态 匹配 ， 提 高 存储 系统 性 能 并 降低 用 
户 成 本 。SmartTier 通过 数据 迁移 将 活跃 度 高 的 “繁忙 ”数据 迁移 至 具有 更 高 性 能 的 存储 
介质 (如 SSD 硬盘 )， 将 活跃 度 低 的 “ 空 亲 ”数据 迁移 至 具有 更 高 容量 且 更 低 容 量 成 本 
的 存储 介质 (如 NL SAS 硬盘 )。 
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SmartTier 的 统计 、 分 析 和 迁移 活动 基于 SmartTier 的 实现 策略 和 数据 的 性 能 要 求 。 
在 统计 、 分 析 、 迁 移 活动 期 间 ， 不 会 对 现 有 业务 的 连续 性 和 数据 可 用 性 造成 影响 。 


5.3.5 SmartQoS 


随 着 存储 技术 的 不 断 进 步 ， 存 储 系 统 能 够 提供 的 存储 容量 越 来 越 大 ， 越 来 越 多 的 
用 户 选 择 将 不 同 的 应 用 程序 后 端 存 储 部 署 在 同一 台 存 储 设备 上 ， 但 同时 也 带 来 了 如 下 
问题 。 

(1) 不 同 应 用 程序 之 间 由 于 业务 模型 和 VO 特征 不 同 相 互 影响 ， 导 致 存储 系统 整体 
性 能 受到 影响 。 

(2) 不 同 应 用 程序 相互 争 抢 系 统 带 宽 和 IOPS 资源 ， 关 键 业 务 性 能 无 法 得 到 保证 。 

SmartQoS 是 一 种 性 能 特性 ， 通 过 动态 地 分 配 存 储 系统 的 资源 来 满足 某 些 应 用 程 
序 的 特定 性 能 目标 。 它 能 够 帮助 用 户 合理 利用 存储 系统 的 资源 ， 同 时 保证 关键 业务 的 
性 能 。 

SmartQoS 特性 允许 用 户 根据 应 用 程序 数据 的 一 系列 特征 COPS 或 占用 带宽 ) 对 每 
一 种 应 用 程序 设置 特定 的 性 能 目标 。 存 储 系统 根据 设 定 的 性 能 目标 ， 动 态 分 配 存 储 系 
统 的 资源 来 满足 特定 应 用 程序 的 服务 级 别 要 求 ， 优 先 保证 关键 性 应 用 程序 服务 级 别 的 

SmartQoS 技术 基于 令 牌 桶 原理 实现 ， 用 户 每 配置 一 个 SmartQoS 策略 ， 系 统 都 会 根 
据 用 户 设置 的 性 能 目标 生成 一 个 令 牌 桶 。 按 照 用 户 配 置 的 性 能 目标 周期 性 向 令 牌 桶 中 放 
入 一 定数 量 的 令 牌 ,每 一 个 受 这 个 SmartQoS 策略 控制 的 IO 请 求 都 必须 从 令 牌 桶 中 获得 
一 个 令 牌 才能 得 到 处 理 ， 如 果 令 牌 桶 中 的 令 牌 取 空 ， 则 只 能 在 等 待 队列 中 等 待 系统 下 一 
RBA HE, WE 5-22 所 示 。 






按照 规定 的 速率 
主机 10 请 求 REBATE 获得 调度 处 理 
对 IO 请 求 分 类 


进入 等 待 队列 等 待 


到 令 牌 桶 获取 令 牌 
图 5-22 令 牌 桶 过 程 


5.3.6 SmartThin 


SmartThin 是 一 种 以 按 需 分 配 的 方式 来 管理 存储 空间 的 技术 ， 利 用 虚拟 化 方法 减少 
物理 存储 部 蓟 ， 可 最 大 限度 提升 存储 空间 利用 率 。 在 存储 空间 配额 范围 内 ， 应 用 服务 器 
用 到 多 少 空间 ， 存 储 系 统 就 给 它 分 配 多 少 空间 ， 从 而 节省 了 宝贵 的 存储 资源 。SmartThin 
与 传统 空间 分 配方 式 比 较 如 图 5-23 所 示 。 
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图 5-23 SmartThin 与 传统 空间 分 配方 式 比 较 
Smart Tier、Smart Thin、Smart Qos 可 以 同时 启用 。 
5.3.7 ”操作 分 级 


操作 分 级 技术 通过 对 产品 所 有 软件 操作 带 来 的 影响 进行 失效 模式 与 影响 分 析 
(failure model and effects analysis，FMEA )， 按 影响 级 别 设 计 对 应 的 防 误 操 作 ， 有 效 预 防 
由 于 人 为 因素 引起 的 错误 操作 。 

根据 系统 、 业 务 与 数据 、 性 能 3 个 关键 因素 对 操作 进行 分 级 ， 有 效 区 分 操作 对 存储 
阵列 的 影响 ， 根 据 不 同 级 别 的 操作 给 出 对 应 的 提示 信息 ， 确 保 不 会 出 现 误 操作 如 图 5-24 
所 示 。 


Level 1: 性 能 降 
i 





图 5-24 ”操作 分 级 


5.3.8 ”硬件 见 余 技术 


高 可 靠 性 是 磁盘 阵列 最 重要 的 特性 之 一 ， 特 别 在 中 高 端 应 用 场景 要 求 任何 一 个 部 件 
的 故障 都 不 能 影响 到 业务 的 正常 运行 ， 这 就 决定 了 磁盘 阵列 必须 对 人 硬件 进行 元 余 设 计 。 
硬件 元 余 技 术 是 磁盘 阵列 最 常用 、 最 基本 的 技术 之 一 。 硬 件 元 余 配置 双 份 或 者 多 份 完 全 
相同 的 硬件 部 件 ， 当 存储 系统 发 现 茶 一 部 件 失 效 后 ， 通 过 相应 的 技术 使 见 余 的 正常 部 件 


106 信息 存储 与 IT 管理 


接管 业务 ， 使 磁盘 阵列 保持 持续 不 间断 的 工作 状态 。 根 据 元 余部 件 的 不 同 ， 主 要 分 为 如 
下 几 种 硬件 元 余 方 式 。 

1. 控制 器 宛 余 技术 

控制 器 见 余 技术 是 指 采 用 两 个 控制 器 进行 见 余 容错 ， 可 分 为 Active/Active、 
Active/Standby 两 种 模式 。 在 Active/Active 模式 中 ， 两 控制 器 都 处 于 工作 状态 并 实现 负 
载 分 担 ， 相 互 监控 对 方 的 健康 状态 。 当 菜 一 控制 嚣 发生 故障 时 ， 男 一 控制 器 在 处 理 本 身 
业务 的 同时 ， 接 管 故 障 控制 器 的 业务 。 在 Active/Standby 模式 中 ， 一 个 控制 器 处 于 工作 
状态 ， 另 一 个 控制 器 则 处 于 待机 状态 并 监控 工作 中 的 控制 器 的 健康 状态 ， 当 检测 到 其 发 
生 故 障 时 ， 立 即 进行 业务 切换 并 接管 业务 。 控 制 器 元 余 技 术 使 得 任何 一 台 控 制 器 发 生 故 
障 时 ， 都 不 会 造成 系统 月 演 和 业务 中 断 。 

2. 电源 宛 余 技术 

电源 是 失效 率 最 高 的 部 件 之 一 ， 几 乎 所 有 的 磁盘 阵列 都 实现 了 电源 见 余 。 电 源 见 余 
是 指 在 一 套 磁盘 阵列 中 提供 两 个 或 两 个 以 上 的 电源 ， 通 常 这 些 电 源 都 有 均 流 功 能 ， 并 且 
输出 合 路 到 同一 线路 上 。 当 某 一 电源 发 生 故 障 时 ， 其 他 电源 提高 输出 功率 ， 直 至 总 电源 
输出 功率 满足 设备 要 求 ， 使 任何 一 个 电源 故障 都 不 会 造成 设备 掉 电 。 

3. 风扇 宛 余 技 术 

风 户 见 余 是 指 磁盘 阵列 中 安装 两 个 或 者 两 个 以 上 的 风扇 对 整个 设备 进行 散热 ， 当 某 
一 风 书 发 生 故 障 时 ， 依 靠 其 他 正常 风扇 对 设备 进行 散热 ， 使 设备 始终 工作 在 正常 的 温度 
范围 内 。 

4. 电池 人 宛 余 技 术 

电池 元 余 是 指 在 磁盘 阵列 中 安装 两 个 或 者 两 个 以 上 的 电池 ， 当 其 中 一 个 电池 发 生 故 
障 时 ， 其 他 电池 能 满足 设备 在 掉 电 后 ， 将 cache 中 的 脏 数 据 完 整地 写 到 保险 箱 硬 盘 中 。 
所 谓 脏 数据 ， 就 是 在 回 写 过 程 中 安全 地 写 到 缓存 ， 但 没有 写 到 非 易 失 性 存储 介质 中 的 
数据 。 

电池 元 余 技 术 并 不 是 磁盘 阵列 必须 具备 的 技术 。 当 电池 没有 进行 元 余 设 计 而 发 生 故 
障 时 ， 系 统 可 以 上 自动 将 业务 由 回 写 设置 为 透 写 状 态 。 当 设置 为 透 写 时 ， 即 使 设备 掉 电 ， 
也 不 会 造成 数据 丢失 。 但 透 写 时 ， 设 备 的 性 能 将 会 降低 。 

回 写 是 一 种 数据 缓存 技术 ， 在 回 写 缓存 技术 中 ， 当 数据 已 安全 地 写 到 缓存 ， 但 没有 
写 到 非 易 失 性 存储 介质 中 时 , 会 同上 层 应 用 返回 写 请 求 完 成 信号 , 以 此 提高 系统 的 性 能 。 
透 写 也 是 一 种 数据 缓存 技术 ， 在 透 写 缓存 技术 中 ， 只 有 在 数据 已 经 安全 地 写 到 非 易 失 性 
存储 介质 中 之 后 ， 才 会 返回 写 请 求 完成 信号 ， 以 此 保证 数据 可 靠 地 保存 。 

5， 硬 盘 元 余 技 术 

硬盘 见 余 是 磁盘 阵列 最 基本 的 见 余 方式 ， 通 常 采 用 应 用 最 广泛 的 硬盘 见 余 阵列 技 
Ñ (RAID) 来 实现 硬盘 见 余 。RAID 技术 可 根据 不 同 的 见 余 方式 ， 设 置 不 同 的 RAID 
级 别 。RAID 技术 在 前 面 的 章节 已 经 进行 了 较为 详细 的 介绍 。 此 外 ， 在 对 磁盘 阵列 的 硬 
盘 进 行 RAID 创建 时 ， 原 则 上 需要 保留 1 个 或 者 1 个 以 上 型 号 相同 的 硬盘 ， 并 将 该 硬 
盘 设 置 为 热 备 盘 工 作 状 态 。 当 RAID 中 的 某 一 硬盘 失效 时 ， 系 统 能 将 失效 硬盘 的 数据 
自动 、 及 时 地 备份 到 热 备 盘 中 。 此 时 即使 RAID 中 再 有 一 块 硬盘 发 生 故 障 ， 也 不 会 造 
成 数据 丢失 。 待 设备 维护 工程 师 更 换 RAID 中 的 故障 硬盘 后 ， 系 统 可 以 再 将 已 备份 到 
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热 备 盘 的 数据 回 找到 更 换 后 的 硬盘 中 。 使 用 硬盘 见 余 技术 ， 大 大 提高 了 数据 的 可 靠 性 
和 一 致 性 。 


5.3.9 ” 掉 电 保护 技术 


为 了 提高 存储 系统 的 性 能 ， 存 储 系统 将 控制 器 中 的 内 存 作为 高 速 组 种 〈cache) 区 
域 ， 主 机 系统 的 数据 写 入 存储 系统 时 ， 只 要 写 入 控制 器 的 cache 完成 ， 存 储 系统 即 啊 应 
写 操作 已 完成 ,主机 系统 可 进行 其 他 数据 的 写 操作 , 当 写 入 cache 的 数据 容量 达到 设置 
值 时 ， 再 将 数据 写 入 硬盘 ， 从 而 提高 存储 系统 的 性 能 。 然 而 内 存 作 为 易 失 性 存储 器 件 ， 
当 没 有 工作 电压 对 数据 进行 定时 刷新 时 ， 保 存在 内 存 中 的 数据 将 会 丢失 。 为 了 保护 内 
存 中 的 数据 不 在 磁盘 阵列 发 生 故 障 时 丢失 ， 磁 盘 阵 列 的 供电 电源 需要 外 接 UPS 或 切换 
成 内 置 的 BBU 模块 进行 供电 。 供 电 电源 掉 电 时 ， 系 统 在 非常 短 的 时 间 内 控制 UPS 或 
BBU 给 磁盘 阵列 供电 ， 并 在 这 段 时 间 内 ， 将 内 存 中 的 数据 完整 地 写 入 硬盘 中 ， 防 止 数 
Ti ER | 


5.3.10 ”保险箱 技术 


保险 箱 技术 是 为 了 有 效 防止 外 部 电源 断 电 对 系统 可 能 造成 的 影响 而 采用 的 技术 。 在 
意外 断 电 的 情况 下 ，cache 中 的 数据 会 由 于 DRAM 的 易 失 性 而 丢失 。 而 保险 箱 盘 能 够 在 
外 部 电源 断 电 的 情况 , 通过 BBU 模块 得 到 供电 ,确保 断 电 后 cache 中 的 数据 能 够 安全 写 
入 保险 箱 盘 中 , 保证 了 数据 的 完整 性 和 可 靠 性 。 同 时 , 保险 箱 盘 还 具有 特殊 的 保护 机 制 ， 
能 够 保证 保险 箱 盘 自身 的 可 靠 性 。 

保险 箱 技 术 的 工作 原理 如 图 5-25 所 示 。 


Ewo Eee me Ge 
存储 盘 MRAR 存储 盘 MRAR 
未 断 电 断 电 后 


图 5-25 ”保险箱 技术 的 工作 原理 


5.3.11 ”镜像 通道 技术 


在 掉 电 保护 技术 章节 中 介绍 到 ， 为 了 提高 系统 的 性 能 ， 主 机 系统 的 数据 写 入 cache 
中 而 没 真 正 写 入 到 硬盘 时 ， 存 储 系统 响应 写 操作 已 完成 ， 主 机 系统 将 进行 其 他 数据 的 写 
操作 。 此 时 ， 如 果 控 制 器 发 生 故 障 ，cache 中 的 数据 将 会 丢失 。 为 了 解决 该 问题 ， 设 计 
硬件 时 ， 在 两 个 元 余 的 控制 器 中 增加 了 高 速 链 路 通道 ， 即 镜像 通道 。 在 主机 系统 的 数据 
写 入 控制 器 的 cache 的 同时 ， 通 过 镜像 通道 将 数据 写 入 另 一 控制 器 的 cache， 即 主机 系统 
的 数据 同时 保留 在 磁盘 阵列 的 两 个 控制 器 的 cache 中 ， 即 使 某 一 控制 器 发 生 故障 ， 也 可 
通过 另 一 控制 器 将 未 写 入 硬盘 的 数据 完整 地 写 入 硬盘 中 。 

镜像 通道 技术 的 工作 原理 如 图 5-26 所 示 。 
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图 5-26 ”镜像 通道 技术 的 工作 原理 


5.3.12 ” 热 插 拨 技 术 


人 硬件 见 余 技术 可 以 实现 茶 一 部 件 发生 故 障 时 , 不 造成 系统 业务 中 断 。 但 在 部 件 发 生 故 
障 后 ， 需 要 及 时 更 换 故障 部 件 ， 以 降低 整 机 故障 的 风险 。 但 在 更 换 部 件 时 ， 为 保证 业务 正 
种 运行 ， 不 能 对 系统 下 电 ， 这 就 要 求 系统 部 件 支 持 热 插 拔 功能 。 所 谓 热 插 拔 Chot swap), 
束 是 允许 用 户 在 不 关闭 系统 、 不 切断 电源 的 情况 下 , 取出 和 更 换 发 生 故 障 的 控制 器 、 电 源 、 
风扇 、 电 池 和 硬盘 等 部 件 ， 从 而 极 大 地 提高 系统 扩展 性 、 灵 活性 和 对 灾难 的 及 时 恢复 能 力 
等 ， 使 磁盘 阵列 的 容错 能 力 大 大 提高 ， 为 用 户 提 供 了 最 大 限度 的 可 靠 性 和 可 用 性 。 

热 插 拔 功能 需要 软 、 硬 件 的 共同 支持 ， 包 括 文 持 热 插 拔 功 能 的 硬件 设备 、 操 作 系 统 
以 及 支持 热 插 拔 功能 的 总 线 ， 等 等 。 其 中 PCI-Express 热 插 拔 技术 对 于 热 插 拔 硬件 的 应 
用 来 说 意义 重大 ， 目 前 已 经 有 着 非常 广泛 的 应 用 。 


5.3.13 SSD 缓存 技术 


近年 来 ，SSD 硬盘 发 展 迅猛 ， 如 何 利 用 SSD 硬盘 存 取 速度 快 的 特点 ， 通 过 将 SSD 
硬盘 作为 存储 系统 的 cache 来 有 效 降低 内 存 对 普通 机 械 硬 盘 的 访问 延 时 ， 也 成 为 了 当今 
的 研究 热点 。 其 中 , SSD 缓存 技术 便 是 较 成 熟 的 研究 成 果 之 一 , 在 实践 中 得 到 了 广泛 应 用 。 
SSD mse cbt 2 RREK SSD sw cache 资源 池 , 通过 系统 对 数 


i cache Rie. po SSD 存 取 速 度 RIER 提升 应 用 服务 器 的 读 写 
性 能 ， 提 高 应 用 服务 器 的 访问 效率 。SSD 缓存 技术 的 工作 原理 如 图 5-27 所 示 。 





图 5-27 SSD 缓存 技术 的 工作 原理 
SSD 缓存 技术 在 高 性 能 、 高 可 用 性 、 高 扩展 性 等 方面 也 有 其 独特 的 优势 。 
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高 性 能 : 测试 表明 ，SSD 缓存 技术 针对 Web Server 类 及 File Server 类 应 用 ， 随 机 读 
性 能 均 有 数 倍 提升 。 

高 可 用 性 : cache 资源 池 由 多 块 SSD 组 成 ， 当 单个 SSD 盘 片 失效 时 ， 不 影响 cache 
的 功能 。 

高 扩展 性 : SSD 缓存 技术 文 持 在 线 添加 SSD ft o 


5.3.14 ”多 路 径 技术 


在 实际 使 用 中 ， 存 储 阵列 中 的 数据 常常 由 与 之 相连 的 主机 系统 《通常 为 服务 器 ) 调 
度 。 当 某 台 主机 发 生 故 障 时 ， 与 之 相关 的 业务 也 会 中 断 ， 造 成 数据 与 业务 的 丢失 。 为 了 
防止 这 种 情况 出 现 ， 磁 盘 阵 列 与 多 台 主 机 相连 ， 当 某 台 主机 发 生 故 障 时 ， 可 以 将 故障 主 
机 的 业务 切换 到 其 他 主机 上 ， 而 这 必须 借助 多 路 径 技术 实现 。 

多 路 径 技术 包 插 硬件 与 软件 两 方面 。 在 硬件 上 ， 磁 盘 阵 列 风 余 的 控制 器 需要 通过 交 
换 机 实现 路 径 的 元 余 配置 ， 在 主机 系统 和 磁盘 阵列 中 建立 两 条 或 多 条 并 行 的 连接 。 在 软 
件 上 ， 需 要 在 主机 系统 上 安装 多 路 径 软 件 ， 同 时 必须 在 磁盘 阵列 中 增加 相应 的 设备 驱动 
程序 ， 以 完成 负载 均衡 、 故 障 切换 、 逻 辑 单 元 屏蔽 等 功能 。 

多 路 径 技术 的 工作 原理 如 图 5-28 所 示 。 


| | ee: 
Gee! ESSE) fees) fee 


磁盘 阵列 磁盘 阵列 磁盘 阵列 磁盘 阵列 
无 故障 主机 A 故障 
5-28 ”多 路 径 技 术 的 工作 原理 


5.3.15 SAS 级 联 技术 
SAS 级 联 技术 是 重要 的 用 于 整体 提升 磁盘 阵列 存储 容量 


的 技术 。 如 果 将 控制 框 的 SAS 接口 通过 SAS 级 联 电 缆 连 接 到 硬盘 杠 
硬盘 框 的 SAS 接口 (对 于 FC 硬盘 框 ， 则 为 SFP 接口 ， 可 通 
过 光纤 连接 )， 可 将 控制 框 中 的 多 个 硬盘 和 硬盘 框 中 的 多 个 硬 硬盘 框 


盘 串 接 起 来 形成 一 个 Loop。 而 在 单一 硬盘 框 不 能 满足 存储 资 

源 空间 需求 的 应 用 场合 , 还 可 以 通过 级 联 多 个 硬盘 框 的 级 联 端 

升 磁盘 阵列 的 存储 容量 。 图 5-29 SAS 级 联 技术 的 
SAS 级 联 技术 的 工作 原理 如 图 5-29 Aras. ee 


硬盘 框 


5.4 ”华为 存储 阵列 产品 及 应 用 


华为 存储 阵列 产品 主要 包括 OceanStor V3 系列 统一 存储 产品 与 OceanStor 高 端 存储 
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系统 。 

其 中 ，OceanStor 高 端 存储 系统 是 华为 存储 的 高 端 旗舰 产品 系列 ， 包 插 OceanStor 
18500 和 OceanStor 18800 两 种 型 号 .OceanStor 高 端 存储 系列 基于 Smart Matrix 智能 矩阵 
架构 和 XVE (extreme virtual engine) 全 虚拟 化 专用 操作 系统 ， 最 大 可 扩展 至 16 个 控制 
器 、3 216 块 硬盘 、7 168TB 容量 、192GB 系统 带宽 、3TB Cache、192 个 主机 接口 
(FC/FCoE/iSCSI)， 支 持 企业 级 SSD. SAS 和 NL-SAS 便 盘 ， 最 大 支持 65 536 台 服 务 器 
共同 使 用 。 软 件 方 面 ，OceanStor 高 端 存 储 配 备 SMART 系列 资源 管理 软件 和 Hyper 系列 
数据 保护 软件 ， 最 大 提升 资源 利用 效率 ， 提 供 关 键 业 务 智 能 优先 保障 和 7x24 小 时 业务 
可 用 性 。 鉴 于 第 7 章 和 第 13 章 将 会 对 OceanStor 高 端 存储 系统 进行 详细 介绍 ， 这 里 不 再 
FIR 

华为 OceanStor V3 系列 产品 是 面向 中 高 端 存 储 应 用 的 新 一 代 产 品 ，V3、2600 V3, 
5500 V3、5600 V3、5800 V3 和 6800V3。 下 面 将 分 别 从 产品 定位 、 软 硬件 形态 和 组 件 、 
典型 应 用 、 关 键 特性 、 安 装 方法 方面 深入 了 解 OceanStor V3 系列 存储 系统 。 


5.4.1 ”产品 定位 


OceanStor V3 系列 存储 系统 在 实现 文件 和 块 的 统一 、 协 议 的 统一 和 管理 界面 的 统一 
的 基础 上 ， 以 业界 领先 的 性 能 为 支撑 ， 融 合 了 高 密 硬盘 设计 、TurboModule 接口 模块 及 
热 插 拔 设计 、TurboBoost 三 级 性 能 加 速 技术 、 多 重 数据 保护 等 高 端 技术 ， 能 够 满足 大 型 
数据 库 联机 事务 处 理 、 高 性 能 计算 、 数 字 媒 体 、 互 联网 运营 、 集 中 存储 、 备 份 、 容 灾 、 
数据 迁移 等 不 同业 务 应 用 的 需求 ， 有 效 保证 用 户 业 务 的 安全 性 与 连续 性 。 
存储 系统 的 定位 如 表 5-4 所 示 。 





表 5-4 产品 定位 
2200 V3 入 门 级 
2600 V3 入 门 级 
5500 V3 中 高 端 
5600 V3 中 高 端 
5800 V3 中 高 端 
6800 V3 高 端 入 门 


5.4.2 ” 软 硬 件 形态 和 组 件 


存储 系统 的 硬件 结构 在 5.1 节 中 已 经 充分 而 深入 的 展开 介绍 了 ， 在 这 里 不 再 费 述 。 
下 面 简要 介绍 其 软件 结构 。 

存储 系统 提供 丰富 的 全 套 存 储 管理 软件 ， 方 便 用 户 轻 松 快捷 地 管理 和 维护 存储 

存储 系统 软件 由 存储 系统 端 软件 、 维 护 终 端 软件 、 应 用 服务 器 端 软件 《SAN ) 组 成 ， 
软件 总 体 架 构 如 图 5-30 所 示 。 
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维护 终端 软件 应 用 服务 器 端 软件 (SAN) 
wa i RR SARNIA ge ig la wl a ae an = 
OceanStor OceanStor 
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OceanStor 
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图 5-30 ”存储 系统 软件 架构 


存储 系统 软件 组 成 和 功能 如 表 5-5 所 示 。 
表 5-5 存储 系统 软件 组 成 和 功能 





存储 系统 端 软件 采用 XVE (eXtreme virtualization engine) 专用 操作 系 
统 ， 实 现 硬件 管理 和 支撑 存储 业务 软件 的 运行 。 存 储 系统 通过 基本 功 


存储 系统 端 软 件 能 控制 软件 实现 基础 的 数据 存储 和 读 写 功能 ;通过 增值 功能 控制 软件 
实现 各 种 备份 、 容 灾 和 性 能 调 优等 高 级 功能 ; 通过 管理 功能 控制 软件 
实现 对 存储 系统 的 管理 功能 
维护 终端 软件 用 于 系统 配置 与 维护 。 用 户 可 以 通过 维护 终端 的 
维护 终端 软件 OceanStor Toolkit. OceanStor SystemReporter 和 OceanStor Cloud 


Service 等 软件 对 存储 系统 进行 配置 和 维护 


在 SAN 网 络 下 ， 应 用 服务 器 端 软件 可 与 存储 系统 通信 ， 使 双方 能 够 
应 用 服务 器 端 软件 CSAN) | 配合 执行 某 些 操作 。 应 用 服务 器 端 软件 包括 ReplicationDirector、 
UltraPath 和 eSDK OceanStor 
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以 上 各 模块 的 功能 、 特 性 、 技术 将 在 后 面 内 容 中 或 华为 相应 培训 课程 中 详细 介绍 ; 
5.4.3 ”典型 应 用 


OceanStor 5500 V3/5600 V3/5800 V3 存储 系统 具有 领先 业界 的 硬件 规格 、 灵 活 可 靠 
的 硬件 设计 、 虚 拟 化 的 底层 架构 和 各 种 数据 保护 技术 ， 能 够 满足 各 种 存储 应 用 场景 下 的 
使 用 要 求 。 其 典型 应 用 如 下 。 

1， 高 性 能 应 用 

OceanStor 5500 V3/5600 V3/5800 V3 存储 系统 有 多 种 提升 性 能 的 措施 。 首先 系统 采 
用 高 性 能 硬件 ， 具 有 出 色 的 数据 读 取 性 能 。 其 次 采用 虚拟 化 技术 ， 确 保存 储 性 能 可 持续 
提升 ， 避 免 因数 据 增 长 而 带 来 性 能 不 足 的 问题 。 此 外 系统 还 采用 了 智能 数据 分 级 技术 
(SmartTier)， 可 智能 识别 热点 数据 ， 并 优先 保证 其 性 能 。 因 此 系统 可 满足 各 种 高 性 能 应 
用 的 需求 。 

2. 高 可 用 性 应 用 

OceanStor 5500 V3/5600 V3/5800 V3 存储 系统 采用 高 可 靠 性 设计 ， 保 证 存储 系统 长 
时 间 无 故障 运行 ， 确 保存 储 系统 承载 的 业务 具有 高 可 用 性 。 还 支持 多 种 数据 保护 技术 ， 
保证 各 种 情况 下 数据 的 安全 ， 即 使 在 毁灭 性 的 灾难 下 ， 也 能 确保 业务 正常 持续 运行 。 

3. 高 密度 多 业务 应 用 

OceanStor 5500 V3/5600 V3/5800 V3 存储 系统 提供 业界 出 色 的 单杠 接口 密度 以 及 高 
度 灵活 的 接口 类 型 与 硬盘 类 型 配置 ， 能 够 满足 高 密度 多 业务 的 应 用 场景 。 


5.4.4 ”产品 特点 


OceanStor 5500 V3/5600 V3/5800 V3 存储 系统 具有 高 规格 的 硬件 结构 、 块 和 文件 一 
体 化 的 软件 架构 ， 结 合 多 种 高 级 数据 应 用 和 数据 保护 技术 ， 使 存储 系统 具有 高 性 能 、 高 
可 扩展 性 、 高 可 靠 性 和 高 可 用 性 等 特点 ， 满 足 大 中 型 企业 对 存储 产品 的 各 种 要 求 。 

l. 统一 存储 

(1) SAN 和 NAS 存储 技术 的 统一 

包含 SAN 和 NAS 存储 技术 的 统一 存储 系统 可 同时 支持 结构 化 和 非 结构 化 数据 存储 。 

(2) 存储 协议 的 统一 

支持 iSCSI, FC. NFS, CIFS 等 主流 存储 网 络 协议 。 

2. 高 性 能 

OceanStor 5500 V3/5600 V3/5800 V3 存储 系统 具备 3 级 性 能 加 速 技术 ， 能 够 逐步 提 
升 存储 性 能 ， 满 足 各 种 应 用 对 存储 性 能 的 需求 。3 级 性 能 加 速 包括 以 下 几 种 。 

(1) 高 规格 硬件 加 速 

OceanStor 5500 V3/5600 V3/5800 V3 存储 系统 配备 64 位 多 核 处 理 器 、 高 速 大 容量 组 
存 和 多 种 高 速 数据 主机 接口 模块 ， 与 传统 的 存储 系统 相 比 ， 能 够 提供 更 加 卓越 的 存储 
性 能 。 

(2) SmartTier 技术 加 速 

SmartTier 技术 能 够 识别 热点 数据 ， 并 定期 将 热点 数据 迁移 到 性 能 更 高 的 存储 介质 
上 ， 从 而 提升 存储 性 能 。 同 时 ，SmartTier 技术 支持 SSD (solid-state drive) 盘 数 据 缓 存 ， 


第 5 章 存储 阵列 技术 及 应 用 113 


有 效 提高 热点 数据 的 访问 速率 。 

(3) SSD 盘 加 速 

当 业 务 需 要 极 高 的 存储 性 能 时 ，OceanStor 5500 V3/5600 V3/5800 V3 存储 系统 可 以 
满 配 SSD 盘 ， 利 用 SSD 盘 的 高 性 能 ， 存 储 系统 性 能 将 提升 到 最 高 。 

3. 高 可 扩展 性 

OceanStor 5500 V3/5600 V3/5800 V3 存储 系统 具备 出 色 的 可 扩展 性 ， 它 支持 多 种 硬 
盘 类 型 和 主机 接口 模块 。 同 时 ， 主 机 接口 模块 密度 也 处 于 业界 领先 水 平 ， 从 而 带 来 出 色 
的 高 可 扩展 性 。 

OceanStor 5500 V3/5600 V3/5800 V3 存储 系统 支持 的 硬盘 类 型 、 主 机 接口 模块 类 型 
如 下 。 

(1) 硬盘 类 型 : SAS、NL-SAS 和 SSD. 

(2) 主机 接口 模块 类 型 : 8Gbit/s FC. 16Gbit/s FC. GE. 10Gbit/s TOE 和 10Gbit/s 
FCoE. 

4. 高 可 靠 性 

OceanStor 5500 V3/5600 V3/5800 V3 存储 系统 对 部 件 失效 和 设备 断 电 均 有 保护 措 
施 ， 同 时 在 降低 硬盘 故障 和 数据 丢失 风险 方面 也 采用 了 先进 的 技术 ， 保 障 了 系统 的 高 可 
靠 性 。 

(1) 部 件 失效 保护 

存储 系统 部 件 采 用 双 宛 余 设 计 和 A/A 工作 模式 (active-active mode)。 在 正常 情况 下 ， 
两 个 部 件 同时 工作 ， 处 理 存 储 业 务 。 当 其 中 一 个 部 件 出 现 故障 或 离线 时 ， 另 外 一 个 部 件 
会 及 时 接管 其 工作 ， 不 影响 现 有 任务 。 

(2) RAID 2.0+ 底 层 虚 拟 化 

存储 系统 采用 创新 的 RAID 2.0+ 底 层 虚 拟 化 技术 ， 实 现 硬盘 自动 负载 均衡 。 当 存储 
系统 某 一 硬盘 发 生 故 障 时 ， 硬 盘 域 内 的 所 有 正常 硬盘 参与 数据 重 构 ， 而 且 仅 重 构 业 务 数 
据 ， 数 据 重 构 速 度 相 对 传统 RAID 提升 20 倍 ， 极 大 降低 了 多 盘 失 效 概 率 。 

(3) 断 电 保护 

存储 系统 提供 内 置 BBU (backup battery unit) 模块 ， 在 突然 断 电 的 情况 下 ， 可 持续 
为 控制 框 供电 ， 确 保存 储 系统 将 cache 中 的 数据 写 入 数据 保险 箱 ， 避 免 数据 丢失 。 

(4) 硬盘 坏 道 修复 

存储 系统 中 较 常见 的 故障 是 硬盘 坏 道 。OceanStor 5500 V3/5600 V3/5800 V3 FEA 
统 采用 硬盘 坏 道 修 复 技术 ， 可 以 自动 修复 硬盘 坏 道 ， 使 硬盘 故障 率 降低 50%， 延 长 了 硬 
盘 的 使 用 周期 。 

(5) 硬盘 数据 预 拷贝 

存储 系统 采用 硬盘 预 拷 贝 技术 。 通 过 例 行 检查 硬件 状态 ， 一 旦 发 现 有 故障 风险 的 硬 
盘 ， 就 主动 迁移 其 数据 ， 有 效 降低 数据 丢失 的 风险 。 

(6) IP 漂移 

存储 系统 采用 IP 漂移 技术 , 一 旦 存储 系统 出 现 承 载 NAS 协议 的 物理 主机 端口 损坏 ， 
就 自动 将 该 端口 P 漂移 到 另 一 个 功能 正常 的 端口 ,配合 正确 的 组 网 方式 ， 可 以 实现 业务 
无 颖 切换 ， 确 保 业 务 不 受 端口 损坏 的 影响 。 
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5. 高 可 用 性 
(1) TurboModule 技术 
OceanStor 5500 V3/5600 V3/5800 V3 存储 系统 采用 TurboModule 技术 、 在 线 扩 容 技 
术 和 硬盘 漫游 技术 ， 避 免 日 常 维护 操作 打 断 业务 运行 。TurboModule 技术 、 在 线 扩容 技 
术 和 硬盘 漫游 技术 的 特点 如 下 。 
。 TurboModule 技术 使 控制 器 、 风 扇 、 电 源 、 接 口 模块 、BBU、 硬 盘 模块 均 可 热 
插 拔 ， 从 而 允许 在 线 操作 。 
。 在 线 扩 容 技术 使 硬盘 域 可 以 在 线 新 增 硬盘 ， 轻 松 扩 容 硬 盘 域 。 
。 硬盘 漫游 技术 使 存储 系统 能 够 自动 识别 更 改 槽 位 后 的 硬盘 ， 并 自动 恢复 其 原 有 
业务 。 
(2) 高 级 数据 保护 技术 
OceanStor 5500 V3/5600 V3/5800 V3 存储 系统 提供 了 多 种 高 级 数据 保护 技术 ， 即 使 
在 毁灭 性 的 灾难 下 , 也 能 够 保障 数据 安全 , 使 业务 正常 持续 运行 .OceanStor 5500 V3/5600 
V3/5800 V3 存储 系统 提供 的 高 级 数据 保护 技术 包括 快照 、LUN 拷贝 、 远 程 复制 、 殉 隆 和 
卷 镜 像 。 
。 快照 能 够 快速 生成 多 个 源 LUN (logical unit number) 的 快照 ， 在 需要 时 实现 数 
据 的 快速 恢复 。 
。 LUN 拷贝 能 够 在 不 同 的 设备 之 间 备 份 数 据 ， 实 现 异 构 存 储 间 的 数据 保护 。 
。 远程 复制 能 够 将 数据 复制 到 异地 ， 实 现 数 据 异 地 备份 容 灾 保 护 。 
。 克隆 能 够 实时 地 构建 源 LUN 的 物理 备份 ， 保 证 数据 在 本 地 的 安全 。 
© 卷 镜像 对 数据 进行 实时 备份 ， 能 够 在 数据 源 出 现 故障 时 ， 自 动 切换 到 数据 副本 ， 
保障 数据 的 安全 性 和 业务 的 连续 性 。 
(3) 资源 应 用 技术 
OceanStor 5500 V3/5600 V3/5800 V3 存储 系统 提供 了 多 种 资源 应 用 技术 ， 提 供 灵 活 
的 资源 管理 方式 ， 保 障 用 户 存 储 投资 效益 。OceanStor 5500 V3/5600 V3/5800 V3 3 存储 系 
统 提 供 的 资源 应 用 技术 包括 异 构 虚 拟 化 、LUN 迁移 和 多 租户 。 
。 异 构 虚 拟 化 能 够 使 本 地 存储 系统 对 第 三 方 存储 系统 中 的 存储 资源 进行 集中 管理 ， 
有 效 降 低 异 构 存 储 系 统 的 管理 难度 ， 降 低 维护 成 本 。 
。 LUN 迁移 能 够 在 存储 系统 内 或 不 同 存储 系统 间 进 行 LUN 业务 迁移 , 实现 随 业务 
发 展 调整 和 分 配 资 源 。 | 
。 多 租户 能 够 使 存储 系统 为 不 同 的 租户 提供 存储 服务 , 并 在 共用 存储 资源 的 同时 隔 
离 租户 间 的 业务 访问 和 管理 ， 实 现 资源 高 效 利用 。 
(4) 内 存 升级 
OceanStor 5500 V3/5600 V3/5800 V3 存储 系统 支持 内 存 升 级 ， 保 证 存储 效能 匹配 业 
务 发 展 。 
6. 高 系统 安全 性 
(1) 管理 通道 安全 
所 有 可 以 对 存储 系统 执行 管理 操作 的 物理 接口 均 使 用 接 入 认证 机 制 ， 保 证 只 有 授权 
用 户 ， 才 能 对 存储 系统 进行 管理 操作 。 
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(2) 操作 系统 安全 

存储 系统 的 操作 系统 经 过 最 新 的 兼容 性 测试 和 漏洞 扫描 ， 确 保存 储 系 统 具 有 广泛 的 
兼容 性 并 且 不 存在 高 风险 漏洞 。 

(3) 协议 与 接口 防 攻击 

存储 系统 所 有 的 对 外 通信 连接 均 是 存储 系统 正常 运行 和 维护 必需 的 ， 使 用 到 的 所 有 
通信 端口 均 在 产品 的 《通信 和 矩阵 》 文 档 中 进行 了 说 明 。 动 态 侦 听 端 口 均 限 定 在 确定 且 合 
理 的 范围 内 ， 不 存在 任何 未 公开 接口 。 

(4) 管理 和 维护 安全 

支持 用 户 的 禁用 和 恢复 ， 此 外 对 所 有 的 管理 操作 指令 都 有 完善 的 日 志 记 录 。 

(5) 数据 加 密 传输 

利用 VPN (virtual private network) 设备 建立 两 台 存 储 设 备 间 的 iSCSI (internet Small 
Computer System Interface) 传输 隧道 ， 通 过 加 密 技 术 对 存储 设备 间 的 数据 进行 加 密 ， 以 
保证 数据 的 私有 性 和 安全 性 。 因 此 , 可 广泛 应 用 于 存储 系统 间 增 值 特性 的 业务 数据 传输 ， 
包括 存储 系统 间 的 LUN 拷贝 、 同 步 远 程 复制 和 异步 远程 复制 。 

(6) 数据 存储 加 密 

支持 部 署 网 络 存储 密码 机 进行 数据 存储 加 密 。 网 络 存储 密码 机 采用 国 密 局 支持 的 标 
准 国 密 算法 ， 通 过 访问 控制 策略 审计 和 控制 主机 的 访问 ， 使 只 有 符合 安全 策略 的 主机 才 
能 访问 存储 系统 数据 。 部 署 网 络 存 储 密 码 机 后 ， 主 机 和 存储 系统 之 间 的 全 部 交互 信息 必 
须 流 经 密码 机 ， 实 现 读 写 数据 的 解密 和 加 密 ， 保 障 存 储 系统 数据 的 安全 性 。 

(7) 数据 销毁 

当 清 除 不 需要 的 数据 时 ， 通 过 对 指定 的 LUN 进行 多 次 擦 写 ， 使 其 存储 的 数据 无 法 
被 恢复 ， 防 止 关 键 数据 外 汇 。 

(8) 业务 接口 与 管理 接口 相互 隔离 

iSCSI 主机 接口 与 心跳 网 口 、 管 理 网 口 和 维护 网 口 之 间 采 用 ACL 机 制 进行 隔离 ， 确 
保 业 务 接口 与 管理 接口 相互 隔离 。 

7. 虚拟 、 智 能 、 高 效 

OceanStor 5500 V3/5600 V3/5800 V3 存储 系统 融合 了 “虚拟 、 智 能 、 高 效 ” 的 先进 
设计 理念 ， 符 合 最 先进 的 存储 设计 思想 。 与 传统 存储 相 比较 ，OceanStor 5500 V3/5600 
V3/5800 V3 存储 系统 具有 更 高 的 存储 空间 利用 率 、 更 快 的 数据 重 构 速度 、 更 智能 的 性 能 
分 配 技术 和 更 精细 的 服务 质量 控制 。 所 采用 的 技术 如 下 。 

(1) RAID 2.0+ 底 层 虚 拟 化 

RAID 2.0+ 底 层 虚 拟 化 技术 将 物理 硬盘 空间 划分 为 多 个 小 粒度 的 数据 块 ， 基 于 数据 
块 构建 RAID 组 和 实现 资源 管理 , 资源 管理 更 加 精细 化 。 RAID 2.0+ 底 层 虚 拟 化 技术 能 够 
实现 硬盘 上 自动 负载 均衡 ， 提 升 存 储 性 能 ， 提 高 存储 空间 利用 率 和 数据 重 构 速 度 ， 以 及 精 
细 管 理 存 储 空间 ， 是 很 多 高 级 存储 技术 的 实现 基础 。 

(2) 智能 数据 分 级 (SmartTier) 

SmartTier 技术 能 够 自动 分 析 单 位 时 间 内 存储 数据 访问 频率 , 根据 分 析 结 果 自 动 将 存 
储 数据 迁移 到 不 同性 能 的 硬盘 中 (高 性 能 层 人 硬盘 存储 活 路 数据 性 能 层 硬 盘存 储 热 点 数 
H: 容量 层 硬 盘存 储 冷 数据 )， 获 得 最 优 的 综合 性 能 并 降低 单位 IOPS (input/output 
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operations per second) 成 本 。 

(3) 智能 服务 质量 控制 (SmartQoS ) 

SmartQoS 技术 可 根据 业务 数据 的 一 系列 特征 进行 分 类 (每 一 种 分 类 代表 一 种 应 用 )， 
并 能 够 对 每 一 种 分 类 设置 优先 级 和 性 能 目标 ， 从 而 将 合适 的 资源 提供 给 合适 的 业务 ， 达 
到 保障 关键 业务 性 能 的 目的 。 

(4) 自动 精简 配置 (SmartThin ) 

SmartThin 技术 使 存储 空间 能 够 根据 需要 自动 扩展 ， 而 不 必 像 传统 方式 那样 一 次 性 
将 存储 空间 全 部 分 配 出 去 ， 只 需要 配置 少量 硬盘 即 可 开展 业务 ， 后 续 再 根据 存储 空间 使 
用 情况 新 增 硬盘 ， 从 而 降低 初次 购买 成 本 和 TCO. 

8. BH. ZA 

OceanStor 5500 V3/5600 V3/5800 V3 存储 系统 采用 CPU 智能 变频 技术 和 智能 风扇 调 
速 技术 、 重 复数 据 删 除 和 压缩 技术 , 保证 在 使 用 过 程 中 的 经 济 性 , OceanStor 5500 V3/5600 
V3/5800 V3 存储 系统 还 提供 多 种 管理 维护 工具 ， 提 升 了 在 使 用 、 维 护 过 程 中 的 易 用 性 。 

(1) 经 济 性 

QD CPU 智能 变频 技术 。CPU 智能 变频 技术 根据 业务 负载 智能 调节 CPU 工作 频率 ， 
在 业务 负载 较 少 时 ， 降 低 CPU 工作 频率 和 工作 功 耗 ， 节 约 运行 成 本 ， 并 能 够 延长 CPU 
的 使 用 寿命 。 

D 智能 风扇 调 速 技术 。 智 能 风 局 调 速 技术 可 根据 系统 温度 智能 调节 风 书 转速 ， 降 
低 风 扇 功 耗 及 噪音 ， 节 省 运行 成 本 。 

@ 重复 数据 删除 和 压缩 技术 。 通 过 重复 数据 删除 技术 检查 和 处 理 硬 盘 中 重复 的 数 
据 ， 通 过 数据 压缩 特性 大 幅 减 少数 据 所 占 空 间 ， 有 效 提高 硬盘 利用 率 。 

(2) 易 用 性 

@) DeviceManager 管理 工具 。DeviceManager 是 基于 GUI 的 存储 系统 管理 工具 ， 通 
过 向 导 式 的 操作 界面 ， 实 现 高 效 管理 。 

DQ 多 种 集成 管理 。 支 持 VMware 的 vCenter plugin 和 Hyper-V 的 System Center 管 
理 集成 ， 虚 拟 化 环境 管理 更 便捷 。 

© Pad 管理 。 支 持 通过 Pad 管理 存储 系统 ， 管 理 方式 灵活 。 

O 多 种 告警 方式 。 支 持 声 音 、 灯 光 、 手 机 短信 和 邮件 等 多 种 告警 方式 ， 确 保 关 键 
信息 及 时 传达 。 

© 一 键 式 升 级 工具 。 实 现 一 键 式 控制 器 在 线 升级 ， 不 但 操作 简便 ， 而 且 无 需 停止 
业务 。 
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完成 本 章 学 习 ， 将 能 够 : 

o 了 解 存储 阵列 系统 的 硬件 组 成 。 

。 熟悉 存储 阵列 系统 的 通用 技术 。 

© 了 解 OceanStor V3 系列 存储 系统 的 特点 与 安装 流程 。 
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5.6 练习 题 


一 、 选 择 题 
1. 存储 阵列 系统 的 硬件 组 成 不 包括 以 下 ) 部 分 。 

A. 控制 框 B. 硬盘 框 cC. 搜索 引擎 D. 文件 引擎 
答案 (C) 
2. 盘 控 分 离 架 构 的 控制 框 不 包括 以 下 C ) 部 分 。 

A. 系统 插 框 B. 硬盘 模块 C. 电源 模块 D. 控制 器 模块 
答案 (B) 
3， 以 下 不 属于 接口 模块 的 是 〈 yo 

A. VO 模块 B. 管理 模块 C. 级 联 模块 D. BBU 模块 
答案 (D) 
4. 以 下 用 于 提升 存储 系统 性 能 的 技术 是 ye 

A. 保险 箱 B. 热 插 拔 C. SmartCache 技术 D. 多 路 径 技术 
答案 (C) 
Se BP ) 技术 不 属于 硬件 元 余 技 术 。 

A. 控制 器 元 余 技 术 B. 接口 元 余 技 术 

C. 风扇 元 余 技 术 D. 电源 元 余 技 术 
答案 (B) 
6. 华为 OceanStor V3 系列 统一 存储 产品 不 包括 以 下 哪 一 个 ? C ) 

A. 5500V3 B. 5600 V3 C. 5700 V3 D. 5800 V3 
答案 (C) 
7. 在 安装 流程 中 ， 下 列 〈 ) 步骤 最 先 执行 。 

A. ERRA B. 上 电 

C. 检查 硬件 安装 D. 初始 化 存储 系统 
答案 (A) 
二 、 简 答题 


1. 控制 框 分 为 盘 控 分 离 和 盘 控 一 体 两 种 架构 ， 请 分 别 阐述 它们 的 特点 。 
.文件 引擎 在 存储 系统 中 的 功能 是 什么 ? 它 由 哪儿 个 模块 组 成 ? 

.请 列举 出 用 于 增强 存储 阵列 系统 可 靠 性 的 几 种 通用 技术 。 

.请 列举 出 级 连 人 硬盘 框 时 的 几 扣 注意 事项 。 
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6.2 
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DAS 概 述 

使 用 SCSI 实 现 DAS 
SAN 的 产生 与 发 展 
SAN 的 组 成 与 部 件 
FC 连 接 和 端口 

FC 协 议 

SAN 与 DAS 的 比较 

华为 解决 方案 及 其 应 用 场景 
本 章 总 结 


6.10 练习 题 





关于 本 章 


网 络 存储 技术 ( network storage technologies ) 是 对 利用 网 络 进行 数据 存储 技术 的 统称 。 目 
前 的 网 络 存储 结构 大 致 分 为 3 种 : 直接 连接 存储 (direct attached storage, DAS) 、 网 络 附加 存 
储 ( network attached storage, NAS ) 和 存储 区 域 网 络 ( storage area network, SAN) 。 其 中 ， 
DAS 是 最 简单 的 一 种 结构 ， 存 储 设备 直接 通过 SCSI 等 总 线 与 服务 器 相连 。 随 着 数据 规模 和 数据 
流量 的 增加 ，DAS 技 术 已 不 能 满足 人 们 的 需求 。 如 今 ，SAN 和 NAS 是 两 种 比较 流行 的 技术 。 

本 章 主要 介绍 SAN， 包含 原理 、 组 成 、 常 见 应 用 场景 及 与 其 他 存储 形态 的 对 比 ，NAS 的 
相关 知识 将 在 第 8 章 介 绍 。 
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6.1 DAS 概述 


6.1.1 DAS 简介 


在 介绍 SAN 之 前 ， 先 介绍 DAS 技术 的 产生 和 发 展 。 

直接 连接 存储 (direct attached storage，DAS)， 就 是 把 一 个 存储 系统 直接 连接 到 一 
个 服务 器 或 工作 站 上 。 

一 个 最 典型 的 DAS 系统 ， 只 包含 一 台数 据 存储 设备 和 一 台 应 用 服务 器 。 把 应 用 服 
务 器 和 存储 设备 直接 通过 总 线 适 配器 相连 , 就 构成 了 一 个 最 简单 的 DAS AA. 其 中 没有 
任何 类 似 交 换 机 、 集 线 器 或 是 路 由 器 的 网 络 设备 。 

如 图 6-1 所 示 的 DAS 组 网 中 ， 存 储 设备 直接 与 文件 服务 器 、 应 用 服务 器 、 数 据 库 服务 
器 连接 ， 各 服务 器 只 能 使 用 与 自己 直接 连接 的 存储 设备 资源 ， 彼 此 之 间 不 能 共享 存储 资源 。 


LAN 





文件 服务 器 站 DE 数据 库 服务 器 





存储 设备 





存储 设备 
RAI 


RA iD 


6-1 一 个 典型 的 DAS 网 络 


6.1.2 DAS 技术 的 发 展 


DAS 是 随 着 网 络 的 发 展 一 起 出 现 的 。 当 Internet 的 雏形 ARPANET 出 现 后 ， 现 代 网 
络 技 术 飞 速 发 展 。 随 着 网 络 的 逐渐 普及 ， 人 们 发 现 很 多 时 候 需 要 在 网 络 中 共享 数据 。 但 
是 ， 在 网 络 中 共享 文件 面临 着 跨 平 台 访 问 和 数据 安全 等 诸多 问题 。 最 初 的 网 络 共享 示意 
图 如 图 6-2 所 示 。 

为 了 解决 网 络 存 储 面 临 的 问题 ， 人 们 发 现 应 当 设 置 一 台 专 门 的 计算 机 来 保存 大 量 的 
共享 文件 。 这 台 计 算 机 一 直 连 接 在 网 络 上 , 允许 整个 网 络 上 的 所 有 用 户 共享 其 存储 空间 。 
通过 这 种 方式 ， 网 络 存 储 迈 问 了 通过 “文件 服务 器 ”共享 数据 的 方向 。 

使 用 专门 的 服务 器 来 提供 共享 数据 存储 ， 需 要 有 大 量 的 存储 磁盘 空间 ， 同 时 还 需要 
保证 数据 的 安全 可 靠 。 众 多 服务 器 的 访问 需求 ， 还 需要 对 文件 共享 服务 器 进行 文件 VO 
方面 的 优化 。 除 此 之 外 , 运行 在 文件 共享 服务 器 上 的 操作 系统 会 造成 额外 的 开销 。 因 此 ， 
在 这 种 方式 下 使 用 的 计算 机 应 当 配 有 仅 具 备 IO 功能 的 操作 系统 ， 不 提供 额外 的 功能 。 
网 络 中 的 用 户 能 够 像 访 问 自己 工作 站 上 的 文件 一 样 访问 这 台 文 件 共 享 服务 器 上 的 文件 ， 


从 而 实现 整个 网 络 中 所 有 用 户 对 文件 共享 的 需求 。 
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数据 C、D 存放 在 用 
户 工 作 站 中 进行 共享 


数据 A、B 存放 在 用 
户 工作 站 中 进行 共享 


图 6-2 早期 的 网 络 共享 示意 图 


DAS 这 个 称呼 是 随 着 存储 网 络 技 术 的 发 展 而 产生 的 。 在 此 之 前 并 没有 DAS 的 说 法 ， 
是 为 了 将 SAN 和 NAS 与 之 前 的 存储 方式 区 分 开 ， 才 将 其 命名 为 DAS。 


6.1.3 


DAS 的 分 类 


DAS 技术 可 分 为 内 置 DAS 和 外 置 DAS 两 类 。 

内 置 DAS， 是 把 存储 设备 在 内 部 通过 串 行 或 并 行 总 线 直 接连 接 到 主机 。 主 机 内 部 的 
硬盘 就 是 内 置 DAS 的 一 个 实例 。 其 中 ， 物 理 总 线 有 距离 限制 ， 只 能 在 短 距离 内 使 用 。 

外 置 DAS， 同 样 是 基于 SCS] 总 线 连接 实现 ， 其 存储 设备 不 放置 于 有 限 的 机 箱 内 ， 
而 是 外 置 ， 这 就 给 存储 空间 的 扩展 提供 了 基础 。 


6.1.4 


DAS 技术 遇 到 的 挑战 


随 着 网 络 技术 的 发 展 ，DAS 的 缺点 逐渐 显现 了 出 来 。 


不 易 扩展 。 要 扩展 DAS， 就 要 改变 存储 设备 。 但 有 限 的 端口 和 有 限 的 带宽 限制 
了 存储 设备 的 规模 ， 限 制 其 VO 处 理 能 力 的 提升 。 

性 能 差 。DAS 的 连接 全 部 通过 一 台 服 务 器 ， 使 得 系统 对 其 性 能 要 求 比较 高 。 
浪费 资源 。 存 储 空间 无 法 充分 利用 ， 存 在 浪费 。 不 同 的 应 用 服务 器 面 对 的 存储 数 
据 量 不 一 致 ， 同 时 业务 发 展 的 状况 也 决定 着 存储 数据 量 的 变化 。 因 此 ， 出现 了 部 
分 应 用 对 应 的 存储 空间 不 够 用 ， 为 一 些 却 有 大 量 的 存储 空间 闲置 。 

管理 分 散 。DAS 方式 数据 依然 是 分 散 的 ， 不 同 的 应 用 各 有 一 套 存 储 设 备 ， 管 理 
分 散 ， 无 法 集中 。 

异 构 化 严重 。DAS 方式 使 得 企业 在 不 同 阶 段 采 购 了 不 同型 号 不 同 厂商 的 存储 设 
备 ， 设 备 之 间 异 构 化 现象 严重 ， 导 致 维护 成 本 据 高 不 下 。 

数据 备份 问题 。DAS 方式 与 主机 直接 连接 ， 在 对 重要 的 数据 进行 备份 时 ， 将 会 
极 大 地 占用 网 络 的 带宽 。 
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这 些 原 因 使 得 DAS 技术 遇 到 了 挑战 ， 并 且 在 此 基础 上 产生 了 SAN 和 NAS 等 存储 
网 络 技术 。 


6.2 使 用 SCSI 实现 DAS 


6.2.1 SCSI 协议 简介 


小 型 计算 机 系统 接口 (small computer system interface, SCSI 是 一 套用 于 连接 计算 
机 和 外 围 设备 的 接口 标准 。SCSI 接口 具有 应 用 范围 广 、 速 度 快 、 带 宽大 、CPU 占用 率 
低 且 支持 热 插 拔 等 优点 ， 可 以 轻松 地 在 各 种 设备 间 传 输 数 据 。 

最 初版 本 的 SCSI 标准 ， 即 SCSI-1 采用 8 位 总 线 ， 传 输 速度 为 SMB/s。SCSI 原本 是 
使 用 并 行 传输 的 协议 ， 但 在 2001 年 使 用 串 行 传输 的 SCSI 接口 标准 产生 了 ， 即 串 行 连接 
的 SCSI (serial attached SCSI, SAS). SAS 也 可 以 用 于 实现 DAS 连接 ， 但 不 是 这 里 讲解 
的 重点 。 我 们 这 里 所 说 的 SCSI， 指 的 是 并 行 SCSI。 

目前 比较 流行 的 SCSI 规格 是 Ultra-320 SCSI， 采 用 的 是 SCSI-3 规范 。 其 可 以 提供 
320MB/s 的 带宽 ， 已 经 是 一 种 相当 成 熟 的 技术 。SCSI-3 与 传统 SCSI 相 比 有 许多 改进 ， 
提供 了 更 快 的 传输 速度 ， 能 够 支持 更 多 更 新 的 设备 。 下 一 部 分 将 详细 探讨 SCSI-3 标准 。 


6.2.2 SCSI-3 协议 简介 


SCSI-3 标准 包括 SCSI-3 体系 结构 模型 和 SCSI-3 实现 标准 。 面 对 一 个 请 求 ，SCSI-3 
系统 首先 将 其 通过 SCSI-3 实现 标准 将 其 转化 为 实现 需求 ， 然 后 再 进行 处 理 。SCSI-3 标 
准 的 功能 范围 如 图 6-3 所 示 。 


SCSI-3 块 命令 SCSI-3 流 命令 SCSI-3 图 形 SCSI-3 转换 
(SBC) (SSC) 命令 (SGC) 命令 (SMC) 
命令 
SCSI 主 命令 
(SPC) 
eS I i | 
SCSI-3 光纤 SCSI-3 串 行 
SCSI-3 互 锁 : å SCSI-3 SSP 
wa) (Sa SBP) 
BITH ae 
体系 结构 总 线 
(SSA-PH) 


接口 (SIP) 
由 图 6-3 可 知 ，SCSI 体系 结构 模型 3 个 最 主要 的 部 分 如 下 。 

















(WYD) 3 d+ 3 St eS 


2 
体 
系 
结 
构 
模 
型 






6-3 SCSI-3 标准 的 功能 范围 
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(1) SCSI-3 命令 : 在 SCSI-3 指令 集中 不 仅 包 含 了 主要 指令 ， 对 于 某 些 特殊 设备 还 
存在 特殊 指令 。 

(2) 传输 层 协议 : 实现 设备 间 通 信和 共享 信息 的 规则 。 

(3) 物理 互 连 层 : 与 接口 相关 的 一 些 细节 ， 如 电子 信号 处 理 方 法 或 数据 传输 模式 等 。 


6.2.3 SCSI-3 通信 模型 


SCSI 通信 采用 客户 端 和 服务 器 (client/server) 模型 进行 通信 。 客 户 端 可 以 向 服务 器 
发 送 一 个 请 求 ， 然 后 服务 器 响应 该 请 求 。 在 SCSI-3 的 C/S 模型 中 ， 一 个 特定 的 SCSI 设 
备 可 以 作为 一 个 SCSI 目标 方 设 备 ， 或 者 作为 一 个 SCSI 发 起 方 设 备 ， 或 者 同时 成 为 一 个 
SCSI 目标 方 和 发 起 方 设备 。 

与 OSI 七 层 模型 相似 ，SCSI 可 分 为 相互 关联 的 三 层 : SCSI 应 用 层 、SCSI 传输 层 和 
SCSI 互 连 层 。 

SCSI 应 用 层 (SCSI application layer, SAL) 包含 客户 端 和 服务 器 端的 应 用 程序 。 

SCSI 传输 协议 层 (SCSI transport protocol layer, STPL) 包含 传输 方 和 接收 方 进行 通 
信 的 协议。 

SCSI 互 连 层 : 这 一 层 实现 了 传输 方 和 接收 方 之 间 的 数据 传输 功能 。 互 连 层 也 被 称 作 
服务 交付 子 系统 ， 包 含 服 务 、 信 和 号 机 制 和 互 连 数 据 传输 等 。 


6.2.4 SCSI 指令 模型 


在 SCSI 标准 中 若 要 传输 数据 ， 首 先 要 发 送 相应 的 指令 。 指 令 是 通过 指令 描述 块 
(command descriptor block, CDB) 来 定义 并 发 送 的 。 每 个 CDB 长 度 为 数字 节 ， 其 中 定 
义 了 与 该 请 求 相 关 的 所 有 操作 。 

常见 的 指令 类 型 如 表 6-1 所 示 。 


表 6-1 常见 的 指令 类 型 
READ 读数 据 
WRITE 写 数据 
TEST UNIT READY 测试 设备 是 否 准备 好 进行 数据 传输 
INQUIRY 询问 基本 信息 ， 也 能 测试 设备 连通 性 
REPORT LUNS 列 出 逻辑 设备 编号 
SEND AND RECEIVE fous er 
DIAGNOSTIC RESULTS 运行 诊断 程序 进行 测试 
FORMAT UNIT 格式 化 ， 设 置 所 有 扇 区 为 0 并 分 配 逻 辑 块 
LOG SENSE 返回 日 志 页 当前 信息 
LOG SELECT 用 于 修改 SCSI 目标 方 设 备 上 日 志 页 的 数据 
MODE SENSE 从 模式 页 返回 当前 设备 参数 
MODE SELECT 在 一 个 模式 页 上 设置 设备 参数 


CDB 开头 的 第 一 字 节 是 操作 码 ， 包 含 分 组 码 字段 和 指令 码 字段 。 分 组 码 描述 指令 参 
数字 段 的 长 度 ， 指 令 码 标识 指令 的 类 型 。 在 操作 码 之 后 ， 紧 接着 的 长 5 字 节 或 更 多 字 节 
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的 部 分 是 指令 参数 。 最 后 是 长 1 字 节 的 控制 字段 , 其 中 实现 了 标准 自动 应 急 处 理 (niormal 
auto contingent allegiance，NACA)， 还 含有 一 些 厂商 信息 等 。 整 个 CDB 块 最 多 不 超过 
16 字 节 。CDB 的 长 度 会 根据 请 求 的 不 同 而 改变 。CDB 结构 如 图 6-4 所 示 。 


2 
DE eae A A 





6-4 CDB 结构 示意 图 


6.2.5 ”基于 SCSI 的 DAS 应 用 


使 用 SCSI 可 以 简单 地 实现 DAS。 首 先 在 服务 器 上 安装 SCSI 卡 ， 实 现 服务 器 内 部 
IO 通道 与 存储 系统 IO 通道 之 间 的 物理 连接 ， 并 进行 内 部 IO 通道 协议 与 SCSI 协议 之 
间 的 转换 。 然 后 将 支持 SCSI 的 存储 设备 通过 SCS] 总 线 连接 到 服务 器 上 ， 就 实现 了 一 个 
简单 的 DAS。DAS 的 优势 主要 集中 在 易 用 性 上 ， 简 单 且 易于 管理 。 但 是 DAS 在 可 扩展 
性 和 性 能 方面 存在 的 问题 限制 了 它 的 应 用 。DAS 主要 应 用 在 中 小 型 企业 中 ， 主 要 面向 本 
地 的 数据 访问 和 共享 。 在 某 些 环境 中 ，DAS 也 可 以 与 SAN 和 NAS 结合 形成 更 加 灵活 的 
存储 结构 。 


6.3 SAN 的 产生 与 发 展 


在 现 有 的 3 种 网 络 存储 技术 中 ，SAN 技术 近 几 年 的 发 展 及 普及 速度 较 快 。 
6.3.1 SAN 概述 


存储 区 域 网 络 (storage area network, SAN) 是 一 种 独立 于 业务 网 络 系统 之 外 ， 以 块 
级 数据 为 其 基本 访问 单位 的 高 速 存 储 专用 网 络 。 这 种 网 络 的 主要 实现 形式 有 光纤 通道 存 
储 区 域 网 络 CFC-SAN). IP 存储 区 域 网 络 (IP-SAN) 和 SAS 存储 区 域 网 络 (SAS-SAN )。 
不 同 的 实现 形式 分 别 采 用 不 同 的 通信 协议 和 连接 方式 在 服务 器 和 存储 设备 之 间 传 输 数 
据 、 命 令 和 状态 。 


6.3.2 SAN 的 产生 


DAS 已 有 近 40 年 的 历史 , 早期 的 数据 中 心 使 用 磁盘 阵列 以 DAS 的 方式 扩展 存储 能 
力 ， 每 一 个 服务 器 的 存储 设备 只 为 单个 应 用 服务 ， 形 成 了 一 种 孤立 的 存储 环境 ， 然 而 这 
些 孤 立 的 存储 设备 难以 共享 和 管理 ， 随 着 用 户 数据 的 不 断 增长 ， 这 种 扩展 方式 在 扩展 及 
灾 备 等 方面 的 弊端 也 日 益 明 显 。 而 SAN 的 出 现 解 决 了 这 些 问 题 ，SAN 将 这 些 存储 孤岛 
用 高 速 网 络 连接 起 来 ， 这 些 存 储 设 备 通过 网 络 能 被 多 个 服务 器 共享 ， 实 现 了 数据 的 异地 
备份 以 及 获得 了 优异 的 扩展 能 力 。 这 些 因素 都 使 得 这 种 存储 技术 快速 发 展 起 来 。 
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6.3.3 SAN 的 发 展 与 主要 形态 


SAN 作为 新 兴 的 存储 解决 方案 ， 以 其 加 快 数据 传输 速度 、 提 供 更 大 灵活 性 、 减 少 网 
络 复杂 性 的 优势 缓解 了 传输 瓶颈 对 系统 的 影响 ， 并 大 大 提高 了 远 端 灾难 备份 的 效率 。 

SAN 是 一 个 由 存储 设备 和 各 种 系统 部 件 构成 的 网 络 架构 , 包括 要 使 用 存储 设备 资源 
的 服务 器 、 用 于 连接 各 存储 设备 的 主机 总 线 适 配器 (host bus adapter, HBA) -FAK FC 
交换 机 等 。 

在 SAN 网 络 中 ， 所 有 与 数据 存储 相关 的 通信 都 在 一 个 与 应 用 网 络 隔离 的 独立 网 络 
上 完成 , 这 也 就 意味 着 数据 在 SAN 中 传输 时 , 不 会 对 现 有 的 应 用 系统 数据 网 络 产生 任何 
影响 , 所 以 , SAN 可 以 在 不 降低 原 有 应 用 系统 数据 网 络 效 率 的 基础 上 提高 网 络 整体 的 IO 
能 力 ， 同 时 增加 了 对 存储 系统 的 元 余 链 接 ， 并 提供 了 对 高 可 用 集群 系统 的 支持 。 

随 着 SAN 存储 网 络 技术 的 不 断 发 展 ， 直 至 现今 形成 了 提 到 的 3 类 存储 区 域 网 络 体系 : 
以 FC 为 基础 的 FC-SAN 光纤 通道 存储 区 域 网 络 、 以 IP 为 基础 的 了 -SAN 存储 区 域 网 络 
和 以 SAS 总 线 为 基础 的 SAS-SAN 网 络 。 接 下 来 分 别 介绍 这 3 种 存储 技术 。 

1. FC-SAN 光纤 通道 存储 区 域 网 络 

这 种 架构 采用 光纤 通道 作为 传播 媒介 ， 以 FC+SCSI 的 应 用 协议 作为 存储 访问 协议 ， 
以 块 级 数据 作为 基本 访问 单位 ， 将 存储 系统 网 络 化 ， 实 现 了 真正 高 速 共 享 存储 的 目标 。 

FC-SAN 提供 了 3 种 基本 连接 方式 ， 分 别 是 点 对 点 (FC-P2P)、 光 纤 通 道 仲裁 环 
(FC-AL) 以 及 交换 式 光 纤 网 (FC-SW)。 在 6.5 节 会 对 这 3 种 方式 进行 更 详细 的 介绍 。 

2. IP-SAN IP 存储 区 域 网 络 

由 于 FC-SAN 的 高 昂 价 格 以 及 自身 的 各 种 缺点 , SAN 技术 并 不 能 得 到 真正 意义 上 的 
广泛 应 用 。 为 了 提高 SAN 的 普及 程度 ， 并 充分 利用 SAN 本 身 所 具备 的 架构 优势 ，SAN 
的 发 展 方向 开始 考虑 和 已 经 普及 的 并 且 相 对 廉价 的 下 网络 融合 。 

简单 而 言 ，IP 存储 就 是 使 用 IP 网 络 而 不 使 用 光纤 网 络 来 做 服务 器 和 存储 设备 的 连 
RAR. P 存储 是 基于 P 网 络 来 实现 块 级 数据 存储 的 方式 。 目 前 除了 标准 已 获 通过 的 
iSCSI, XA FCIP、iFCP 等 标准 。 在 IP 存储 方案 中 ， 数 据 的 传输 是 在 IP 网 络 中 以 块 级 
进行 的 ， 这 使 得 服务 器 可 以 通过 IP 网 络 连 接 到 SCSI 设备 ， 并 且 就 像 使 用 本 地 的 设备 一 
样 , 无 需 关 注 设备 的 实际 地 址 或 者 物理 位 置 。 整个 存储 网 络 连 接 则 以 IP 协议 和 以 太 网 为 
主 ， 以 廉价 并 且 成 熟 的 IP 技术 替换 FC-SAN 中 的 光纤 通道 (FC) 技术 。 这 样 的 存储 解 
决 方案 具备 了 更 好 的 成 熟 性 和 开放 性 ， 并且 由 于 下 设备 的 标准 性 和 通用 性 , 消除 了 传统 
FC-SAN 的 产品 兼容 性 和 连接 性 方面 的 问题 。 基 于 卫 存储 技术 的 新 型 SAN， 同 时 具备 了 
FC-SAN 的 高 性 能 和 传统 NAS 的 数据 共享 优势 ， 为 新 的 数据 应 用 方式 提供 了 更 为 先进 的 
架构 平台 。 

3. SAS-SAN: SAS 存储 区 域 网 络 

作为 一 种 新 的 存储 接口 技术 , SAS 不 仅 功能 能 够 与 光纤 通道 比肩 , 还 具有 兼容 SATA 
的 能 力 ， 因 而 被 业界 公认 为 取代 并 行 SCSI 的 首选 。 | 

SAS-SAN 存储 方案 与 IP-SAN BK FC-SAN 存储 原理 和 架构 相同 , 但 改变 了 存储 设备 
人 硬件。 专业 人 士 认 为 在 企业 级 存储 系统 中 ，SAS 取代 光纤 通道 只 是 个 时 间 问 题 。 

SAS-SAN 的 优点 很 明显 : 存 取 速度 相对 IP-SAN 时 代 有 很 大 的 提高 ， 兼 容 性 能 是 目 
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前 主流 SAN 存储 架构 中 最 好 的 ， 存 储 综合 性 能 属于 中 等 ， 价 格 也 远 低 于 FC-SAN, 适合 
于 中 端 或 中 高 端 存 储 的 关键 应 用 与 大 容量 的 非 关 键 应 用 。 

SAS-SAN 的 缺点 也 是 显而易见 的 ,主要 表现 在 速度 仍 未 达到 FC-SAN KKF, 所 以 
对 速度 有 严格 要 求 的 大 型 高 端 应 用 ， 还 是 无 法 见 到 SAS-SAN 的 身影 ， 并 且 SAS 连接 距 
离 有 限 ， 远 远 低 于 FC-SAN 的 10km 连接 距离 以 及 无 距离 限制 的 IP 网 络 ， 在 远程 容 灾 方 
面 表现 较 差 。 

SAS-SAN 存储 ， 由 于 低廉 的 价格 、 更 好 的 兼容 和 适中 的 综合 存储 性 能 ， 正 不 断 在 新 
兴 市 场 中 扩大 其 分 额 。 在 抢占 原本 属于 IP-SAN 存储 的 中 低 端 市 场 的 同时 ， 在 中 高 端 存 
储 市 场 中 ， 考 虑 到 成 本 因素 ， 一 些 用 户 逐 渐 以 SAS-SAN 存储 来 替代 昂贵 的 FC-SAN 旧 
系统 ， 在 更 新 设备 的 同时 ， 也 减少 了 相对 高 额 的 维护 费用 。 


6.4 SAN 的 组 成 与 部 件 


6.4.1 SAN 的 结构 


在 FC-SAN 中 ,存储 服务 器 上 通常 配置 两 个 网 络 接口 适配器 : 一 个 用 于 连接 业务 IP 
网 络 的 普通 网 卡 (network interface card，NIC)， 服 务 器 通过 该 网 卡 与 客户 机 交互 ; 男 一 
个 网 络 接口 适配器 是 与 FC-SAN 连接 的 主机 总 线 适 配器 (hoat bus adaptor, HBA), AKA 
器 通过 该 适配器 与 FC-SAN 中 的 存储 设备 通信 。FC-SAN 的 结构 示意 图 如 图 6-5 所 示 。 
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图 6-5 FC-SAN 的 结构 示意 图 


6.4.2 SAN 的 连接 组 件 


SAN 由 存储 网 络 领域 中 的 多 种 组 件 构 成 。 其 中 最 主要 的 是 光纤 通道 交换 机 、HBA 
以 及 在 存储 网 络 中 使 用 的 存储 设备 。 

1. 存储 区 域 网 络 交 换 机 

存储 区 域 网 络 交换 机 目前 常见 的 是 用 于 FC-SAN 的 光纤 交换 机 和 用 于 IP-SAN 的 以 
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太 网 交换 机 。 图 6-6 所 示 为 FC 交换 机 的 设备 图 。 





图 6-6 FC 交换 机 的 设备 图 


光纤 交换 机 提供 了 一 种 物理 连接 手段 以 实现 FC-SAN 中 的 任意 节点 之 间 的 通信 。FC- SAN 
交换 机 为 建立 光纤 网 络 提供 了 所 需 的 硬件 和 软件 基础 ， 硬 件 本 身 具 有 可 供 磁盘 阵列 和 服务 器 
等 基于 FC 的 设备 连接 的 端口 (Port)。 在 本 章 6.5 节 会 更 详细 地 介绍 FC 的 连接 与 端口 。 

光纤 交换 机 避免 了 共享 带宽 的 问题 ， 在 同一 时 刻 ， 连 接 到 交换 机 上 的 设备 可 以 任意 
通信 ， 因 此 ， 交 换 机 能 让 任意 两 个 设备 都 拥有 一 个 光纤 通道 带宽 。 

以 太 网 交换 机 功能 与 光纤 交换 机 所 起 的 作用 是 类 似 的 ， 只 是 底层 协议 是 TCP/IP。 

2. 主机 总 线 适 配器 

主机 总 线 适 配器 Chost bus adapter, HBA) 实现 主机 端 存储 协议 的 转换 ， 目 前 常见 
的 有 FC-SAN 环境 下 使 用 的 FC HBA 卡 、IP-SAN 环境 中 使 用 的 iSCSI HBA 卡 和 用 于 
SAS-SAN 环境 下 的 SAS HBA 卡 。 当 然 ， 在 IP-SAN 环境 下 ， 主 机 与 存储 设备 或 者 存储 
区 域 网 络 交换 机 的 连接 还 可 以 通过 普通 的 以 太 网 卡 或 者 TOE 网 卡 实现 。 各 类 HBA 卡 如 
6-7 所 示 。 


FC HBA 卡 iSCSI HBA 卡 SAS HBA 卡 





图 6-7 HBA 卡 


下 面 主 要 介绍 FC-SAN 环境 中 使 用 的 HBA 卡 。 

要 在 FC-SAN 中 工作 ， 服 务 器 需要 安装 一 种 特殊 的 主机 适配器 ， 这 种 适配器 与 网 络 
适配器 类 似 ， 称 为 FC-HBA 卡 。FC-HBA 提供 了 光纤 存储 网 络 的 驱动 功能 ， 使 服务 器 可 
以 与 光纤 交换 机 通信 ， 进 而 登录 到 存储 网 络 并 与 存储 设备 通信 。 

HBA 是 服务 器 内 部 IO 通道 与 存储 系统 IO 通道 之 间 的 物理 连接 。 最 常用 的 内 部 IO 
通道 是 PCI-E 和 SBus， 它 们 是 服务 器 CPU 和 外 围 设备 之 间 的 通信 协议 ， 在 主机 主板 上 实 
现 了 这 种 通信 协议 。 最 常见 的 存储 系统 IO 通道 是 IDE、SCSI 和 FC， 它 们 各 自 采 用 自己 
的 协议 实现 存储 系统 与 主机 之 间 的 通信 。 存 储 设 备 上 通常 有 控制 器 ， 控 制 器 可 实现 一 种 或 
几 种 通信 协议 ， 可 以 实现 从 IDE. SCSI. FC 等 存储 协议 到 物理 存储 设备 的 操作 协议 之 间 的 
转换 。 服 务 器 内 部 需要 一 种 设备 (扩展 卡 或 主板 上 的 集成 电路 ) 来 实现 内 部 通信 协议 CPCI. 
Sbus 等 ) 与 存储 系统 通信 协议 (IDE、SCSI、FC 等 ) 之 间 的 转换 ， 这 种 设备 就 是 HBA. 

内 部 通道 到 IDE 的 转换 器 通常 集成 在 主板 上 ， 不 需要 专门 的 适配器 。 内 部 通道 到 
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SCSI 的 转换 器 就 是 SCSI 卡 ， 它 是 一 种 常见 的 HBA 卡 。 内 部 通道 到 FC 的 转换 器 就 叫 作 
HBA， 它 实现 了 FC 协议 中 的 FC-0、FC-1 和 FC-2 层 的 功能 。 | 

3. 存储 设备 

最 后 , 光纤 网 络 中 使 用 的 存储 设备 应 当 与 FC 兼容 , 也 就 意味 着 它们 必须 使 用 FC 的 
规范 与 网 络 通信 。 

SAN 中 的 存储 设备 有 很 多 种 ， 如 磁盘 阵列 (RAID )、 光 盘 库 、 磁 带 库 等 。 


6.4.3 FC-SAN HJ 


FC-SAN 使 用 光纤 作为 线 绕 ， 光 纤 是 一 种 通信 线 绕 ， 由 玻璃 质 纤 维 作 为 传导 体 ， 这 
些 光 纤 艺 位 于 保护 性 的 履 层 内 ， 外 部 由 塑料 层 覆 盖 。 沿 内 部 光纤 进行 的 信号 传输 一 般 使 
用 红外 线 。 

光纤 的 分 类 标准 有 以 下 几 种。 

l. 按 传输 方式 分 类 

根据 传输 方式 的 不 同 ， 可 以 把 光纤 分 为 两 类 : 单 模 光纤 (single mode fiber, SMF) 
和 多 模 光 纤 (multi mode fiber, MMF). 

(1) SMF 

ARHAR ICV EGR Ee Be i. FLU RE ER), VIEH Ea ot 
的 激光 源 。 单 模 光 纤 的 特点 是 模 间 色散 很 小 ， 能 让 光 以 很 宽 的 频带 传输 比较 长 的 距离 ， 
适用 于 远程 通信 。 

(2) MMF 

多 模 光 纤 允 许多 种 不 同 光 束 在 其 中 传播 。 其 中 心 玻璃 蕊 较 粗 ， 相 比 于 单 模 光 纤 ， 多 模 
光纤 允许 使 用 更 廉价 的 接线 器 ， 成 本 大 大 降低 。 然 而 多 条 光束 在 线 缆 中 传播 ， 模 间 色 散 较 大 ， 
并 且 随 着 距离 的 增加 表现 得 更 加 严重 。 因 此 ， 多 模 光 纤 仅 适用 于 短 距 离 的 线 缆 传 输 。 

2. 按 材 料 分 类 

(1) RAHA: 纤 必 与 包 层 都 是 琉璃， 损耗 小 ， 传 输 距 离 长 ， 成 本 高 。 

(2) 胶 套 硅 光 纤 : 纤 蕊 是 玻璃 ， 包 层 为 塑料 ， 特 性 同 玻璃 光纤 差不多 ， 成 本 较 低 。 

(3) WRG: 纤 蕊 与 包 层 都 是 塑料 ， 损 耗 大 ， 传 输 距 离 很 短 ， 价 格 很 低 ， 多 用 于 
家 电 、 音 响 ， 以 及 短 距 的 图 像 传输 。 

3， 按 折射 率 分 类 

C1) 阶 越 光 纤 : 光纤 纤 忆 的 折射 率 是 均 义 的， 带宽 罕 ， 用 于 短 距 小 容量 传输 。 

(2) 渐变 光纤 : 光纤 纤 忆 的 折射 率 到 玻璃 外 层 的 折射 率 逐 渐变 小 ， 带 宽大 ， 适 用 于 
大 容量 传输 。 


6.5 FC 连接 和 端口 


6.5.1 FC 架构 简介 
FC 架构 是 组 成 FC-SAN 的 基础 。 光 纤 通 道 (fiber channel, FC) 是 一 种 高 速 的 网 络 
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技术 ， 每 秒 可 传递 数 GB 的 数据 。 顾 名 思 义 ，FC 架构 采用 光纤 线 缆 作 为 传输 介质 。 

FC 网 络 技术 从 1988 年 起 步 ，1994 年 得 到 ANSI 标准 认证 。 在 其 后 数 年 的 研究 中 ， 
FC 的 履 盖 范围 变 得 更 大 ， 传 输 速度 变 得 更 快 ， 同 时 还 添加 了 对 各 种 高 层次 协议 的 支持 ， 
如 ATM、IP、SCSI。 与 之 前 提 到 的 SCSI 相 比 ， 光 纤 通 道 最 大 的 优势 就 是 速度 快 。 同 时 ， 
FC 架构 还 具有 高 度 的 可 扩展 性 。 一 个 FC 网 络 ， 理 论 上 可 以 容纳 1 500 万 个 设备 。 


6.5.2 FC 拓扑 结构 与 所 用 端口 


1，FC 端口 

网 络 中 的 端口 (port) 是 网 络 设 备用 来 与 其 他 设备 相连 接 的 接口 。 在 FC 网 络 中 ， 不 
同 设备 连接 的 端口 ， 由 于 在 网 络 中 具有 不 同 的 功能 ， 被 定义 为 不 同类 型 的 端口 。 

光纤 通道 标准 定义 了 以 下 几 种 端口 。 

N-port: 结 点 端口 (node port, N-port) 是 访问 光纤 通道 网 络 的 服务 器 和 存储 设备 上 
的 问 口 ， 用 来 初始 化 帧 和 接收 帧 。 

F-port: 交换 端口 〈fabric port, F-port) 是 交换 机 上 的 端口 。F-port 与 N-port 相连 ， 
构成 一 一 对 应 关系 。 当 一 个 N-port 与 另 一 个 N-port 相连 接 时 ， 通 过 各 自在 交换 机 上 的 
F-port 实现 。 

L-port: 环 端口 〈loop port，L-port) 存在 于 光纤 通道 环 网 中 。 和 交换 式 网 络 不 同 ， 
环 状 网 络 中 的 节点 共享 一 个 线 线 带宽 的 结构 。L-port 用 来 和 该 环 中 的 其 他 L-port 直接 
通信 。 

除 此 之 外 ， 为 了 能 让 环 路 和 交换 网 络 相 互通 信 ， 需 要 允许 L-port 和 N-port 之 间 进 行 
通信 。 为 此 ， 光 纤 网 络 中 还 定义 了 两 个 混合 端口 : NL-port 和 FL-port。FL-port 是 交换 机 
上 的 端口 ， 可 以 加 入 光纤 通信 环 网 中 进行 交互 。NL-port 具有 N-port 和 L-port 的 双重 功 
能 ， 使 得 两 种 结构 之 间 的 通信 成 为 了 可 能 。 

FC 网 络 中 主要 端口 的 示意 图 如 图 6-8 所 示 。 





FC 交换 机 feeen 





6-8 FC 网 络 端口 示意 图 
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2. 其 他 端口 

光纤 网 络 中 还 有 一 些 其 他 闻 口 。 

(1) E-port: 两 个 通信 交换 机 之 间 的 端口 ， 用 于 光纤 网 络 的 级 联 。 

(2) G-port: 在 通信 交换 机 上 ， 既 可 以 作 E-port 使 用 ， 也 可 以 作 F-port 使 用 。 

(3) Auto port: 能 够 自动 匹配 所 需 端 口 。 

除 此 之 外 ， 还 有 一 些 功能 型 的 端口 ， 如 B-port 和 D-port， 用 于 网 络 中 的 桥接 和 诊断 
等 功能 。 

3. FC 拓扑 结构 

拓扑 结构 是 指 网 络 中 各 个 设备 连接 的 方式 。 决 定 使 用 哪 种 结构 ， 主 要 是 由 光纤 网 络 
中 设备 的 数量 决定 的 。 光 纤 网 络 的 拓扑 结构 决定 了 网 络 中 使 用 的 端口 。 这 里 的 端口 不 仅 
仅 是 硬件 意义 上 的 端口 ， 还 是 在 网 络 中 运行 交换 信息 的 实体 。 

光纤 通信 和 网络 的 拓扑 结构 最 简单 的 主要 有 3 种 : 点 对 点 结构 、 环 状 结构 和 交换 式 
结构 。 


(1) 点 对 点 (FC-P2P) 
点 对 点 结构 指 的 是 两 台 设 备 直 接连 接 在 一 起 ， 
如 图 6-9 所 示 。 作 为 最 简单 的 拓扑 结构 ， 它 的 用 途 比 


较 小 。FC-P2P 中 只 需要 N-port 即 可 实现 。 6? PORE a ee 

(2) 环 状 结构 (FC-AL, arbitrated loop) 

为 了 控制 简单 ， 在 环形 结构 中 ， 与 环形 网 络 一 样 将 所 有 设备 连 成 一 个 环 。 同 样 地 ， 
任意 一 台 设 备 的 失效 都 会 导致 整 个 结构 崩 演 ， 并 且 增 删 设备 会 中 断 整 个 环 上 传输 的 所 有 
数据 。 在 环 上 ， 同 时 只 能 有 一 对 端口 进行 数据 传输 。 

环 状 结构 定义 了 L-port 端口 ， 如 图 6-10 所 示 。 

(3) 交换 式 结构 (FC-SW，switched fabric) 

在 交换 式 结 构 中 ， 使 用 一 台 交 换 机 ， 将 其 他 所 有 设备 连接 到 交换 机 上 ， 由 交换 机 来 
管理 。 交 换 机 会 给 每 个 设备 分 配 一 个 24 位 地 址 。 

交换 机 上 使 用 的 是 F-port， 用 以 控制 节点 之 间 的 连接 如 图 6-11 所 示 。 


) Oe Co gm 
aCe) ce 
图 6-10 FC-AL 结构 示意 图 图 6-11 FC-SW 结构 示意 图 


除 此 之 外 ,FC 网 络 可 以 通过 之 前 提 到 的 混合 端口 进行 组 合 , 以 连接 几 种 不 同 的 结构 。 


第 6 章 SAN 技术 及 应 用 131 


6.6 FC 协议 

FC-SAN 使 用 光纤 通道 协议 (fiber channel protocol, FCP) 来 实现 数据 传输 。 其 不 仅 
可 以 高 速 传输 数据 ， 还 具有 扩展 性 高 的 优点 。 
6.6.1 FC 层次 结构 


FC 协议 构成 了 FC-SAN 的 基本 框架 , 是 串 行 SCSI 在 FC 网 络 上 的 实现 。 FCP 与 OSI 
模型 不 同 ， 分 为 5 个 层次 ， 如 图 6-12 所 示 。 


ies rae 6-12 FCP arama 


l. FC-4 2 

FC-4 在 整个 协议 中 位 于 最 上 层 ， 这 一 层 定义 了 与 应 用 的 接口 ， 并 实现 了 与 上 层 协 议 
的 交互 。FC 标准 定义 了 几 种 可 以 在 FC-4 层 上 操作 的 协议 ， 如 SCSI、IP、 蜡 步 传 输 模 式 
(ATM) 等 。 

2. FC3 4 

FC-3 层 定义 了 一 些 高 级 应 用 中 所 需 的 公共 服务 ， 在 这 一 层 的 协议 中 ， 可 以 管理 一 组 
端口 的 信息 列表 ， 提 供 对 于 端口 信息 的 通用 服务 。 

3. FC-2 Æ 

FC-2 层 进 行 光 纤 通 道 编 址 ， 控 制 结 构 和 数据 组 织 形式 。 

4. FC-1 Æ 

FC-1 层 在 传输 前 对 数据 编码 ， 传 输 完成 之 后 解码 。 在 发 起 端 ， 一 个 8 位 字符 编码 成 
为 10 位 的 传输 字符 ， 然 后 传输 到 接收 端 。 接 收 端 将 其 解码 为 原来 的 8 位 字符 。 速 度 为 
10Gbit/s 以 上 的 FC 使 用 更 多 位 编码 以 加 快速 度 。 

同时 ，FC-1 还 定义 了 传输 字 等 ， 并 负责 数据 链 路 的 初始 化 和 故障 诊断 。 

5. FC-0 Æ 

FC-0 层 是 物理 层 。 作 为 FCP 协议 的 底层 ， 这 一 层 定义 了 物理 接口 、 载 体 和 原始 位 
的 传输 规则 。 


6.6.2 ”光纤 通道 编 址 
如 6.5.2 节 所 述 ，FC 地 址 是 动态 分 配 的 ， 交 换 机 会 给 每 个 N-port 分 配 一 个 24 位 地 
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hk, on K 6-13 所 示 。 


E ee we Ean cya. 
图 6-13 24 位 N-port FC 地 址 


在 这 个 地 址 中 ,第 一 字段 标识 了 交换 机 的 域 ID， 这 是 提供 给 架构 中 每 个 交换 机 的 唯 
一 ID。 事 实 上 其 中 只 有 239 个 域 可 用 ， 其 他 作为 保留 字 用 于 fabric 服务 。 分 区 ID 是 用 
于 结 点 连接 的 一 组 端口 的 标识 ， 最 后 一 个 字段 是 端口 ID， 用 于 标识 每 一 个 端口 。 


6.6.3 FC ia 


FC 帧 格式 如 图 6-14 Bras, HS 个 部 分 组 成 : 帧 起 始 CSOF). tisk (frame header), 
A HE EX (data field)、 循 环 元 余 校 验 (cyclic redundancy check, CRC) 和 帧 结尾 (end of frame, 
EOF )。 

SOF 和 EOF 作为 两 个 帧 之 间 的 分 隔 符 ， 同 时 SOF 还 可 以 标记 出 某 个 帧 是 否 为 一 列 
帧 中 的 第 一 帧 。 

帧 头 长 度 为 24 Fii. WE 6-14 AR, WAW ID (S_ ID)、 目 标 ID (D ID)、 序 列 
ID (SEQ_ID)、 序列 计数 (CSEQ_CNT)、 始 发 交换 ID (OX_ID) 以 及 应 答 交 换 ID (RX_ID) 
等 ， 男 外 ， 其 中 还 含有 一 些 控制 字段 。 


数据 段 2112 字 节 










可 选 头 有 效 部 分 
Optional Payload 
header 2048 字 节 







64 字 节 


控制 位 源 ID | BFD | 类 型 | 序列 计数 | 序列 ID | 交换 ID 
CTL Source ID ID Type SEQ_CNT SEQ_ID | Exchange_ID 
图 6-14 FCP 帧 格式 


其 中 ，S ID 和 D ID 是 对 端口 的 标识 ， 为 标准 的 FC 地 址 。 

帧 头 中 ， 还 包含 以 下 字段 。 

路 由 控制 (R_CTL) 指明 一 个 帧 是 数据 帧 还 是 链 路 帧 。 

特定 类 别 控制 《CS_CTL) 指定 各 FC 服务 类 的 数据 传输 速率 。 

KRI (TYPE) 描述 了 该 帧 所 需 携 带 的 上 层 协 议和 控制 信号 。 如 该 帧 是 数据 帧 且 Type 
字段 是 08， 说 明 这 个 帧 会 携带 SCSI 协议 。 

帧 控制 CF_CTL) 摘 述 该 帧 的 控制 信息 ， 如 对 帧 类 型 的 说 明 等 。 

数据 段 控 制 (DF_CTL) 描述 数据 段 开 始 的 头 部 ， 可 以 通过 它 来 扩展 头 部 信息 。 
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6.6.4 FC 协议 的 优 劣 


FCP 采用 基于 信用 的 流量 控制 机 制 ， 有 效 提升 了 网 络 的 利用 率 。 在 存储 环境 中 ， 发 
出 的 块 VO 请 求 的 大 小 一 般 为 4KB 一 64KB， 而 FC 的 帧 大 小 是 2KB。 因 此 大 于 2KB 的 
H IO 请 求 必 须 被 分 成 多 个 小 的 段 ， 以 适应 FC 帧 大 小 。 在 FC 协议 中 ， 分 段 和 重组 操作 
是 在 网 卡 中 实现 的 ， 减 轻 了 主机 CPU 的 负担 。 

但 是 由 于 组 成 结构 的 特殊 性 , FC 协议 与 现 有 的 以 太 网 是 完全 异 构 的 , 两 者 不 能 相互 
连接 。 因 此 光纤 通道 是 具有 封闭 性 的 , 不仅 不 能 与 现 有 的 企业 内 部 网 络 (以太 网 ) RA, 
也 不 能 与 其 他 不 同 厂商 的 光纤 通道 网 络 接 入 (由 于 厂家 对 FC 标准 理解 的 异样 ，FC 设备 
的 兼容 性 存在 巨大 的 难题 )。 因 此 , 以 后 存储 网 络 的 扩展 由 于 兼容 性 的 问题 而 成 为 了 难题 ， 
而 且 由 于 FC 协议 的 特性 ， 网 络 建 完 后 ， 加 入 新 的 存储 子 网 时 ， 必 须 重新 配置 整个 网 络 ， 
这 也 是 FC 网 络 扩展 的 障碍 。 


6.6.5 FCoE 技术 


新 一 代 的 FC 协议 可 以 与 以 太 网 直接 衔接 ， 这 就 是 FCoE 技术 。 

FCoE 技术 标准 最 早 在 2007 年 由 多 家 IT 厂商 同 美 国 国家 标准 协会 (ANSI) T11 Æ 
员 会 提交 。 通 过 该 技术 标准 可 以 将 光纤 通道 映射 到 以 太 网 ， 将 光纤 通道 信息 插入 以 太 信 
息 包 内 ， 从 而 让 服务 器 至 FC-SAN 存储 设备 的 光纤 通道 请 求 和 数据 可 以 通过 以 太 网 连接 
来 传输 ， 从 而 实现 在 以 太 网 上 传输 FC-SAN 数据 。 

FCoE 人 允许 在 一 根 通信 线 缆 上 进行 LAN 和 FC-SAN 通信 ， 融 合 网 络 可 以 支持 LAN 
和 SAN 数据 类 型 ,减少 数据 中 心 设备 和 线 绕 数 量 ,同时 降低 供电 和 制冷 负载 ,提高 数据 
中 心 的 能 效 比 。 

在 第 7 章 FC 协议 与 TCP 协议 的 融合 部 分 ， 还 将 详细 介绍 FCoE。 


6.7 SAN 与 DAS 的 比较 


l. 可 扩展 性 方面 

当 出 现 新 的 应 用 需求 时 ，DAS 只 能 为 新 的 服务 器 额外 购置 单独 的 存储 设备 ， 既 不 能 
利用 已 有 存储 设备 的 闲置 资源 , 也 不 能 与 已 有 设备 统一 管理 , 而 SAN 的 网 络 架 构 使 服务 
器 可 以 方便 地 接 入 现 有 SAN 环境 ， 较 好 地 适应 了 应 用 变化 的 需求 。 

2 资源 利用 率 方面 

DAS 方式 的 存储 长 期 来 看 存储 空间 无 法 充分 利用 ， 存 在 浪费 。 不 同 的 应 用 服务 器 面 
对 的 存储 数据 量 不 一 致 ， 同 时 业务 发 展 的 状况 也 决定 看 存储 数据 量 的 变化 。 因 此 ， 出 现 
了 部 分 应 用 对 应 的 存储 空间 不 够 用 , 另 一 些 却 有 大 量 存储 空间 闲置 的 问题 。 在 SAN 架构 
下 ， 不 同 存 储 设 备 之 间 可 以 实现 资源 共享 ， 大 大 提高 了 存储 资源 利用 率 。 

3. 统一 的 数据 管理 方面 

SAN 实现 了 不 同 应 用 和 服务 器 数据 物理 上 的 集中 , 空间 调整 和 数据 复制 等 工作 可 以 
在 一 台 设 备 上 完成 ， 所 有 设备 得 到 了 高 效 统一 的 管理 。 | 
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4. 开 构 化 方面 

DAS 方式 使 得 企业 在 不 同 阶段 采购 了 不 同 厂商 不 同型 号 的 存储 设备 , 设备 之 间 异 构 
化 现象 严重 ， 导 致 维护 成 本 居 高 不 下 。 而 多 人 台 服 务 器 可 以 通过 SAN 网 络 同时 访问 后 端 存 
储 系统 , 不 必 为 每 台 服 务 右 单独 购买 存储 设备 , 降低 存储 设备 寞 构 化 程度 , 降低 维护 费用 。 

总 结 来 说 ， 在 DAS 中 ， 特 定 的 存储 设备 专 供 一 台 服 务 器 ， 存 储 资源 难以 共享 ， 分 
期 采购 的 存储 设备 异 构 化 严重 ， 一 些 设备 存储 空间 的 闲置 也 会 使 整体 利用 率 低下 。 当 存 
储 信息 的 数据 量 不 断 变 大 时 ，DAS 的 管理 成 本 会 大 幅 增 加 ， 数 据 安全 性 和 系统 稳定 性 等 
方面 的 不 足 都 限制 了 这 种 技术 的 用 途 。 通 常 仅 适 用 于 小 型 网 络 应 用 。SAN 技术 使 得 所 有 
存储 设备 得 到 统一 管理 ， 实 现 了 存储 整合 ， 多 个 服务 器 之 间 能 够 共享 存储 设备 。 这 种 技 
术 有 效 提 高 了 存储 资源 的 利用 率 ， 优 化 了 管理 成 本 。SAN 架构 拥有 优秀 的 可 扩展 性 、 高 
效 的 存储 资源 利用 、 有 效 的 管理 机 制 和 数据 备份 保护 能 力 。 


6.8 ”华为 解决 方案 及 其 应 用 场景 


在 存储 网 络 领域 ， 华 为 提供 了 多 系列 的 产品 来 满足 不 同 层次 客户 的 需求 。 从 整个 网 
络 解 决 方案 到 交换 机 、 存 储 设备 等 ， 华 为 产品 遍布 存储 网 络 的 各 个 方面 。 其 中 ， 华 为 
OceanStor V3 系列 统一 存储 产品 因 其 具有 独特 的 优势 ， 成 为 了 许多 客户 的 选择 。 

OceanStor V3 系列 在 深入 研究 客户 的 真实 需求 后 ， 推 出 高 性 能 、 高 可 靠 、 高 可 用 、 
高 性 价 比 的 几 种 典型 应 用 方案 。 

l. 高 性 能 方案 一 一 满足 不 同性 能 需求 应 用 系统 的 集中 存储 

(1) 典型 需求 

数据 库 服务 器 : 结构 化 数据 ， 对 性 能 、 数 据 安全 性 、 稳 定性 要 求 高 。 

邮件 服务 器 : 并 发 随机 性 高 ， 对 存储 性 和 数据 安全 性 要 求 高 。 

视频 服务 器 : 存储 容量 需求 大 ， 数 据 访 问 连续 性 强 ， 持 续 带 宽 要 求 高 。 

文件 服务 器 : 相对 性 能 及 带宽 要 求 低 。 

(2) 方案 价值 ` 

分 层 存 储 : FC 和 iSCSI 组 网 方式 灵活 选择 ;SSD/FC/SAS/SATA 分 层 存储 。 

投资 保护 : 关键 和 次 关键 数据 有 机 整合 ,根据 应 用 需求 ,选择 存储 介质 和 组 网 方式 。 

(3) 方案 组 网 

高 性 能 方案 组 网 如 图 6-15 所 示 。 

2. 高 密度 虚拟 机 方案 一 一 可 承载 高 密度 虚拟 机 环境 

(1) 典型 需求 

大 量 虚 拟 机 部 署 ， 随 着 计算 虚拟 化 程度 日 益 提 高 ， 大 量 非 核心 应 用 系统 以 及 虚拟 桌面 均 
被 部 署 到 虚拟 机 中 ， 虚 拟 机 密度 越 来 越 高 ， 对 存储 的 容量 、 性 能 、 扩 展 性 的 要 求 也 越 来 越 高 。 

(2) 方案 价值 

支持 各 种 访问 协议 及 速率 : 1/10GE、4Gb FC. 8Gb FC. 

高 密度 IO 接口 满足 高 密度 虚拟 机 : 最 大 48 个 IO 接口 可 以 满足 高 密度 虚拟 机 部 署 
的 需求 。 
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图 6-15 高 性 能 方案 


降低 TCO: 单 台 设备 通过 扩展 卡 即 足以 承载 数 百 台 虚 拟 机 ， 节 省 网 络 交换 设备 的 投资 。 
(3) 方案 组 网 
高 密度 虚拟 机 方案 组 网 如 图 6-16 所 示 。 


tN 
Cache 


6-16 ”高 密度 虚拟 机 方案 
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3. 高 可 靠 方案 一 KHAK 

(1) 典型 需求 

数据 安全 性 : 数据 集中 存放 在 单一 地 点 ， 地 震 、 水 灾 、 火 灾 等 地 域 性 自然 灾害 会 给 
数据 造成 无 法 恢复 的 损失 。 建 立 异地 数据 容 灾 中 心 ， 确 保 数 据 安全 ， 发 生意 外 灾害 后 能 
快速 恢复 数据 ， 将 损失 减少 到 最 低 。 

(2) 方案 价值 

数据 安全 提供 保证 : 通过 阵列 提供 的 HyperMirror 功能 将 数据 传输 到 异地 的 备份 阵 
列 设备 中 ， 提 供 数据 异地 容 灾 功能 ， 保 证 数据 安全 ， 提 供 数 据 快 速 恢复 功能 。 

(3) 方案 组 网 

高 可 靠 方 案 组 网 如 图 6-17 所 示 。 


广域网 





图 6-17 ”高 可 靠 方案 

4. 高 可 用 方案 一 一 适用 于 高 可 用 性 集群 

(1) 典型 需求 

数据 库 服务 器 、 邮 件 服务 器 : 两 台 或 两 台 以 上 服务 器 组 成 集群 ， 对 数据 可 用 性 要 求 
高 ， 提 供 24 小 时 连续 业务 不 停机 ， 整 个 系统 无 单 点 故障 。 

(2) 方案 价值 

高 可 用 : 支持 主流 集群 应 用 ， 保 证 应 用 高 可 用 ; 多 路 径 保 证 数据 链 路 高 可 用 。 

CRIE: 所 有 部 件 见 余 ， 当 一 个 控制 器 出 现 问 题 后 ， 所 有 应 用 可 以 立即 切换 到 男 
一 个 控制 器 。 

(3) 方案 组 网 

高 可 用 方案 组 网 如 图 6-18 所 示 。 
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$.， 高 性 价 比 方案 

(1) 典型 需求 

应 用 特点 : 应 用 服务 器 多 , 系统 整体 容量 大 ， 
高 并 发 访问 需求 ， 业 务 数据 二 八 现象 明晰 。 

(2) 方案 价值 

高 性 价 比方 案 : 通过 将 不 同业 务 数 据 放置 到 
SSD、FC/SAS、SATA 中 以 合理 分 配 资源 ; 通过 
动态 分 级 存储 功能 对 热点 数据 进行 持续 监控 
并 从 机 械 硬 盘 迁 移 到 SSD 中 ， 进 一 步 提升 系统 
性 能 。 

(3) 方案 组 网 

高 性 价 比 方案 组 网 如 图 6-19 所 示 。 6-18 ”高 可 用 方案 


基于 文件 级 访问 基于 文件 级 访问 基于 文件 级 访问 





分 级 存储 








图 6-19 ”高 性 价 比 方案 


6.9 本章 总 结 


通过 本 章 的 学 习 ， 应 当 能 够 回答 下 面 的 问题 。 

。 目前 网 络 存 储 主 要 有 哪 几 种 方式 ? 

e DAS 是 什么 ? SCSI 是 什么 ? SAN 和 DAS 的 区 别 是 什么 ? 
。 SAN 是 什么 ? SAN 有 哪 几 种 ， 分 别 由 哪些 部 件 组 成 ? 

e FC 是 什么 ”如何 实现 FC-SAN? 
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6.10 ”练习 题 


一 、 选 择 题 
1. 下 列 说 法 正确 的 是 〈 Fo 
A. DAS 就 是 将 存储 设备 和 客户 机 都 接 到 总 线 上 
B. 与 FC 相 比 ，SCSI 协议 具有 应 用 范围 广 、 速 度 快 、 带 宽大 以 及 支持 热 插 拔 等 
优点 
C. 相 比 SCSI，FC 协议 的 层次 结构 与 OSI 模型 更 相似 
D. FC 中 N-Port 和 L-Port 可 以 直接 通信 


ES (A) 
2. 下 面 不 是 常见 网 络 存储 技术 缩写 的 是 js 
A. ANS B. NAS C. SAN D. DAS 
ZR (A) 
3. 下 面 不 属于 SCSI-3 通信 模型 层次 结构 的 是 Je 
A. SCSI 应 用 层 B. SCSI 传输 协议 层 
C. SCSI 互 连 层 D. SCSI 会 话 层 
答案 (D) 
4. 下 面 哪些 是 SCSI 的 CDB 组 成 部 分 ? ( ) 
A. 操作 码 B. 指令 参数 C. 控制 码 D. 数据 段 
答案 (ABC) 
5. 以 下 哪些 是 FC-SAN 的 重要 组 件 ? ( ) 
A. 光纤 通道 交换 机 B. 主机 总 线 适 配器 
C. FC 存储 设备 D. 以 太 网 交换 机 
答案 (ABC) 
6. 光纤 通信 网 络 的 基本 拓扑 结构 有 ¢ Je 
A. 点 对 点 B. 环 状 结构 C. 树 状 结构 D. 交换 式 结构 
答案 (ABD) 
二 、 简 答题 


1. DAS 技术 有 哪些 优 缺 点 ?” 简 述 你 的 想法 。 
2. {HIR SCSI 结构 。SCSI 协议 通信 模型 有 哪儿 层 ? 分 别 有 什 么 作用 ? 
3. FC-SAN 与 DAS 相 比 有 哪些 优势 ? 


ie 
4 
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IP-SAN 的 产生 和 发 展 
IP-SAN 的 组 成 与 部 件 
iSCSI 协议 

FC 协议 与 TCP 协 议 的 融合 
IP-SAN 协 议 的 比较 
IP-SAN 华 为 的 实现 与 应 用 
本 章 总 结 

练习 题 











关于 本 章 


IP-SAN 是 近年 来 十 分 流行 的 一 种 网 络 存储 技术 。 与 上 一 章 主 要 介绍 的 FC-SAN 相 比 ，IP- 
SAN 使 用 了 发 展 成 熟 的 中 网 络 ， 充 分 降低 了 总 体 拥有 成 本 (total cost of ownership, TCO) ， 受 
到 许多 客户 的 欢迎 。 

本 章 从 IP-SAN 的 产生 和 发 展开 始 ， 详 细 阐 述 IP-SAN 网 络 架 构 、 组 成 部 分 、 协 议 构 成 ， 
iSCSI 协议 技术 细节 等 方面 ， 还 对 比 了 几 种 SAN 协 议 的 特点 。 和 希望 通过 本 章 的 学 习 ， 能 对 IP- 
SAN 有 比较 全 面 的 认识 。 
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7.1 IP-SAN 的 产生 和 发 展 


7.1.1 IP-SAN 概述 


在 早期 的 SAN 环境 中 , 数据 以 块 为 基本 访问 单位 在 光纤 通道 中 传播 , 即 早期 的 SAN 
都 是 FC-SAN。 由 于 FC 协议 与 P 协议 不 兼容 ， 要 实现 FC-SAN， 必 须 单独 采购 部 署 
FC-SAN 设备 和 组 件 ， 其 高 昂 的 价格 、 复 杂 的 配置 也 让 众多 中 小 用 户 望 而 却步 。 因 此 ， 
FC-SAN 主要 应 用 于 对 性 能 、 元 余 度 和 可 用 性 等 都 有 较 高 要 求 的 中 高 端 存 储 需 求 。 为 了 
提高 SAN 的 普及 程度 和 应 用 范围 ， 并 充分 利用 SAN 本 身 所 具备 的 架构 优势 ，SAN 的 发 
展 方 向 开始 考虑 和 已 经 普及 并 且 相 对 廉价 的 IP 网 络 进 行 融合 。 因 此 ， 使 用 已 有 P 网 络 
构架 的 IP-SAN 应 运 而 生 ，IP-SAN 是 标准 的 TCP/IP 协议 和 SCSI 指令 集 相 结合 的 产物 ， 
是 基于 IP 网 络 来 实现 块 级 数据 存储 的 方式 。 


7.1.2 IP-SAN 的 发 展 、 趋 势 


IP-SAN 与 FC-SAN 的 区 别 在 于 传输 协议 和 传输 介质 不 同 。 常 见 的 IP-SAN 协议 有 
iSCSI, FCIP、 iFCP 等 , 其 中 , iSCSI 是 发 展 最 快 的 协议 标准 , 大 多 时 候 我 们 所 说 的 IP-SAN 
是 指 基 于 iSCSI 协议 的 SAN. 

基于 iSCSI 的 SAN 的 目的 就 是 要 使 用 本 地 iSCSI Initiator (启动 器 ,通常 为 服务 器 ) 
通过 IP 网 络 和 iSCSI Target (目标 器 ,通常 为 存储 设备 ) 来 建立 SAN 网 络 连接 。IP-SAN 
结构 如 图 7-1 所 示 。 









Sh D 以 太 网 交换 机 
TCP/IP 网 络 


RAID 





SAN 存储 设备 SAN 存储 设备 SAN 存储 设备 
JBOD 磁带 驱动 器 及 带 库 RAID 


7-1 IP-SAN 结构 示意 图 
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因为 每 个 主机 和 存储 设备 都 支持 以 太 网 接口 和 iSCSI 协议 栈 、 因 此 ， 设 备 可 以 直接 
连接 到 以 太 网 交换 机 或 者 路 由 器 上 ， 通 过 标准 的 IP 协议 实现 到 IP 网 络 的 直接 连接 。 同 
If, iSCSI 规范 还 允许 IP 层 提 供 诸如 IPSec 数据 加 密 功 能 来 保证 数据 传输 的 安全 性 ， 并 
且 与 光纤 通道 一 样 ，IP-SAN 存储 也 是 交换 式 架构 的 。 

与 FC-SAN 相 比 ，IP-SAN 具备 自己 的 优势 ， 这 些 优势 来 源 于 其 使 用 的 iSCSI 协议 。 
iSCSI 是 建立 在 TCP/IP 协议 和 SCSI 指令 集 基 础 之 上 的 标准 化 协议 。 

IP-SAN 主要 有 以 下 几 方 面 的 优点 。 

© 接 入 标准 化 。 不 需要 专用 的 HBA 卡 和 光纤 交换 机 ， 只 需要 普通 的 以 太 网 卡 和 以 
太 网 交换 机 就 可 以 实现 存储 和 服务 器 的 连接 。 

。 传输 距离 远 。 理 论 上 只 要 是 P 网 络 可 达 的 地 方 ， 就 可 以 使 用 P-SAN, 而 人 网 

-” 络 是 目前 地 球 上 应 用 最 为 广泛 的 网 络 。 

。 可 维护 性 好 。 大 部 分 网 络 维护 人 员 都 有 IP 网 络 基 础 ，IP-SAN 上 自然 比 FC-SAN 更 
容易 被 人 接受 。 另 一 方面 ， 卫 网络 维 护 工 具 已 经 非常 发 达 ，IP-SAN 充分 发 扬 了 
拿 来 主义 。 

。 后 续 带 宽 扩 展 方便 。 因 为 iSCSI 是 承载 于 以 太 网 的 ， 随 大 10GB 以 太 网 的 迅速 发 
展 ，IP-SAN 单 端 口 带 宽 扩 展 到 10GB 已 经 是 发 展 的 必然 。 

这 些 优势 使 得 产品 的 总 体 拥 有 成 本 ‘TCO) 降低 ， 比 如 建设 一 个 存储 系统 ， 总 
体 拥 有 成 本 包括 需要 购买 磁盘 阵列 、 接 入 设备 “HBA 和 交换 机 )、 人 员 培 训 、 日 常 
维护 、 后 续 扩 容 、 容 灾 扩 展 等 。IP-SAN 因为 IP 网 络 的 广泛 应 用 优势 ， 可 以 大 幅 降 
低 单 次 采购 的 接 入 设备 采购 成 本 、 减 少 维护 成 本 ,而 且 后 续 扩 容 和 网 络 扩 展 成 本 也 
大 幅 降 低 。 


7.2 IP-SAN 的 组 成 与 部 件 


7.2.1 IP-SAN 的 组 成 


IP-SAN 因为 基于 IP 协议 ， 所 以 能 容纳 所 有 IP 协议 网 络 中 的 部 件 。 用 户 可 以 在 任何 
需要 的 地 方 创建 实际 的 SAN 网 络 , 而 不 需要 专门 的 光纤 通道 网 络 在 服务 器 和 存储 设备 之 
间 传 送 数据 。 同 时 ， 因 为 没有 光纤 通道 对 传输 距离 的 限制 ，IP-SAN 使 用 标准 的 TCP/IP 
协议 ， 数 据 即 可 在 以 太 网 上 传输 。 

IP-SAN 主要 由 如 图 7-2 所 示 的 几 部 分 组 成 。 

。 支持 iSCSI 的 存储 设备 。 

© 以 太 网 交换 机 。 

e 以 太 网 卡 和 iSCSI initiator 软件 。 

© 以 太 网 网 线 。 
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用 户 A 用 户 B 服务 器 服务 器 
以 太 网 卡 以 太 网 卡 以 太 网卡 iSCSIHBA 卡 







LAN 


以 太 网 交换 机 


iSCSI 存储 设备 iSCSI 存储 设备 


图 7-2 IP-SAN 组 件 


7.2.2 IP-SAN 组 网 连接 


IP-SAN 的 典型 组 网 有 3 种 ,分别 是 直 连 式 、 单 交换 和 双 交 换 。 

L. EN 

主机 与 存储 设备 之 间 直 接 通过 以 太 网 卡 、TOE FE iSCSI HBA 卡 连接 , 这 种 组 网 方 
式 的 优点 是 实现 简单 ， 成 本 低 ， 缺 点 是 较 多 的 主机 分 享 存 储 资源 比较 困难 。 直 连 组 网 的 
示意 图 如 图 7-3 所 示 。 






以 太 网 卡 
7-3 HER 


应 用 服务 器 


2. HRP 

主机 与 存储 设备 之 间 连 接 一 台 以 太 网 交换 机 ， 同 时 主机 安装 以 太 网 卡 、TOE FR 
iSCSI HBA 卡 实现 连接 。 单 交换 组 网 的 示意 图 如 图 7-4 所 示 。 从 图 中 可 以 看 出 这 种 组 网 
结构 的 优点 ， 即 能 使 多 台 主 机 共享 同一 台 存 储 设备 ， 与 直 连 式 相 比 具 有 较 强 的 扩展 性 ， 
缺点 是 交换 机 处 发 生 故 障 会 使 主机 无 法 访问 存储 设备 。 


以 太 网 交换 机 





应 用 服务 器 
图 7-4 单 交 换 组 网 


第 7 章 IP-SAN 技术 及 应 用 145 


3. 双 交换 

同一 台 主 机 到 存储 阵列 端 可 由 多 条 路 径 连 接 ， 如 图 7-5 所 示 。 这 种 结构 扩展 性 强 ， 
与 单 交换 方式 相 比 ， 即 使 以 太 网 交换 机 处 形成 单 点 故障 ， 主 机 仍然 能 通过 其 他 路 径 访 问 
存储 设备 。 





以 太 网 交换 机 
7-5 NIRAN 


7.3 iSCSI 协议 


7.3.1 iSCSI 协议 简介 


上 一 章 介绍 SAN 时 曾 提 到 SCSI 可 以 用 来 实现 DAS。 基 于 iSCSI 协议 的 IP-SAN 把 
用 户 的 请 求 转 换 成 SCSI 代码 ， 并 将 数据 封装 进 P 包 内 在 以 太 网 中 传输 。 

iSCSI (the internet small computer systems interface) 是 一 种 基于 SCSI 和 TCP/IP 的 
协议 。 iSCSI 是 最 主要 的 IP-SAN 协议 , 广泛 应 用 于 许多 采用 IP-SAN 架构 的 存储 网 络 中 。 


7.3.2 iSCSI 协议 模型 


1. iSCSI 数据 包 封装 模 型 

支持 iSCSI 的 服务 器 可 以 配置 一 块 专用 的 iSCSI 主机 总 线 适 配器 卡 。 所 有 的 SCSI 
命令 都 被 封装 成 iSCSI 协议 数据 单元 (protocol data unit, PDU), iSCSI 会 利用 TCP/IP 
协议 栈 中 传输 层 的 TCP 协议 为 连接 提供 可 靠 的 传输 机 制 ， 在 封装 TCP 数据 段 头 以 及 
IP 数据 包头 后 ,其 内 部 所 封装 的 SCSI 命令 或 数据 对 于 底层 网 络 设备 而 言 是 不 可 见 的 ， 
网 络 设 备 只 会 将 其 视 为 普通 IP 数据 包 进 行 传递 ， 从 而 实现 SCSI 指令 和 数据 的 透明 
传输 。 

2. 协议 数据 单元 

在 iSCSI 环境 下 ， 数 据 通信 的 基本 单元 称 为 iSCSI PDU (protocol data unit, PDU). 
PDU 被 封装 进 IP 数据 包 进 行 通信 ， 所 有 的 iSCSI PDU 都 包含 一 个 或 多 个 报头 ， 其 后 可 
能 没有 或 有 多 个 数据 段 。 

IP 报头 提供 数据 包 在 网 络 上 传输 的 路 由 信息 。TCP 报头 信息 可 以 确保 数据 被 传送 到 
指定 目标 。iSCSI 报头 描述 了 目标 器 提取 SCSI 指令 和 数据 的 方式 。 为 了 确保 数据 的 完整 
性 一 iSCSI 增加 了 一 个 称 为 数据 摘要 的 可 选 循环 风 余 校 验 码 CCRC). 
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3. iSCSI 协议 栈 

iSCSI 协议 命令 层 是 SCS 协议 内 容 ， 主 要 实现 数据 块 在 TCP/IP 协议 中 的 封装 。 客 
户 端 和 服务 器 通过 发 送 请 求 和 啊 应 来 进行 相互 间 的 通信 ，SCSI 命令 和 数据 被 封装 成 
TCP/IP 数据 包 在 网 络 中 传输 。 SCSI 应 用 (文件 系统 、 数 据 库 ) 

iSCSI 是 一 种 会 话 型 协议 ,用 于 在 SCSI 
命令 和 设备 之 间 建 立会 话 。iSCSI 会 话 层 SCSI 块 指令 其 他 SCSI 指令 
负责 处 理 登 录 、 了 验证、 发 现 目 标 和 会 话 
管理 。 SCSI 指令 、 数 据 和 状态 

TCP 协议 在 传输 层 上 为 iSCSI 提供 相 
应 的 传输 服务 ， 用 于 控制 消息 流 、 窗 口 、 错 


iSCSI 


误 恢 复 和 重 发 功能 。 TCP 
IP 协议 在 网 络 层 负责 提供 全 局 寻 址 和 

连接 。 
数据 链 路 层 负责 物理 网 络 中 的 点 对 点 

通信 。 物理 层 (以 太 网 ) 
iSCSI 协议 层 模型 如 图 7-6 所 示 。 图 7-6 iSCSI 协议 层 模型 


7.3.3 iSCSI 体系 结构 


在 支持 iSCSI 的 系统 中 ， 当 用 户主 机 上 层 业 务 系统 需要 向 一 台 SCSI 存储 设备 发 送 
读 写 数据 的 请 求 时 ， 主 机 操作 系统 对 该 请 求 进行 处 理 ， 并 将 该 请 求 转换 成 一 条 或 者 多 条 
SCSI 指令 ， 然 后 传 给 目标 SCSI 控制 卡 。 指 令 和 数据 被 封装 〈encapsulation ) 起 来 ， 形 成 
一 个 iSCSI 包 ， 然 后 该 数据 封装 被 传送 给 TCP/IP 层 ， 再 由 TCP/IP 协议 将 iSCSI 包 封 装 
成 卫 协议 数据 以 适合 在 网 络 中 传输 。 也 可 以 对 封装 的 SCSI 命令 进行 加 密 处 理 ， 然 后 在 
不 安全 的 网 络 上 传送 。 

数据 包 可 以 在 局 域 网 或 Internet 上 传送 。 在 接收 存储 控制 器 上 ， 数 据 包 被 重新 组 合 ， 
然后 存储 控制 器 读 取 iSCSI 包 中 的 SCSI 控 制 命令 和 数据 ,并 发 送 到 相应 的 磁盘 驱动 器 上 ， 
磁盘 驱动 器 再 执行 初始 计算 机 或 应 用 所 需 的 功能 。 如 果 发 送 的 是 数据 请 求 ， 那 么 将 数据 
从 磁盘 驱动 器 中 取出 进行 封装 后 ， 发 送 给 发 出 请 求 的 计算 机 ， 而 这 整个 过 程 对 于 用 户 来 
说 都 是 透明 的 。 

尽管 SCSI 命令 的 执行 和 数据 准备 可 以 使 用 标准 TCP/IP 和 现成 的 网 络 控制 卡 的 软件 
来 完成 ， 但 是 在 利用 软件 完成 封装 和 解 封 装 的 情况 下 ， 在 主机 处 理 器 上 实现 这 些 功 能 需 
要 很 多 的 CPU 运算 周期 来 处 理 数 据 和 SCSI 命令 .如果 将 这 些 事务 交 给 专门 的 设备 处 理 ， 
则 可 以 将 对 系统 性 能 的 影响 减少 到 最 小 程度 。 因 此 , 发 展 在 iSCSI 标准 下 执行 SCSI 命令 
和 完成 数据 准备 的 专用 iSCSI 适配器 是 有 必要 的 .iSCSI 适配器 结合 了 NIC 和 HBA 的 功 
能 。 这 种 适配器 以 块 方式 取得 数据 , 利用 TCP/IP 处 理 引 擎 在 适 配 卡 上 完成 数据 分 发 和 处 
理 ， 然 后 通过 IP 网 络 送出 IP 数据 包 。 这 些 功能 的 完成 使 用 户 可 以 在 不 降低 服务 器 性 能 
的 基础 上 创建 一 个 基于 卫 的 SAN。 

iSCSI 体系 结构 示意 图 如 图 7-7 所 示 。 
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iSCSI 


Initiator 





图 7-7 iSCSI 体系 结构 示意 图 


7.3.4 iSCSI 的 启动 器 和 目标 器 


iSCSI 的 通信 体系 仍然 继承 了 SCSI 的 部 分 特性 , 在 iSCSI 通信 中 , 具有 一 个 发 起 IO 
请 求 的 启动 器 设备 (Initiator〉 和 啊 应 请 求 并 执行 实际 IO 操作 的 目标 器 设备 〈Target)。 
在 Initiator 和 Target 建立 连接 后 ，Target 在 操作 中 作为 主 设备 控制 整个 工作 过 程 。 

1. iSCSI Initiator 

iSCSI 局 动 器 可 分 为 3 种 , 即 软件 Initiator 驱动 程序 、 硬 件 的 TOE(TCP offload engine, 
TCP HRI) FAK iSCSI HBA 卡 。 就 性 能 而 言 ， 软 件 Initiator 驱动 程序 最 差 ，TOE 
卡 居中 ，iSCSI HBA 卡 最 佳 。 

2. iSCSI Target 

iSCSI 目标 器 通常 为 iSCSI 磁盘 阵列 、iSCSI 磁带 库 等 。 

iSCSI 协议 为 Initiator 和 Target 定义 了 一 套 命 名 和 寻 址 方法 。 所 有 的 iSCSI 节点 都 是 
通过 其 iSCSI 名 称 被 标识 的 。 这 种 命名 方式 使 iSCSI 名 称 不 会 与 主机 名 混淆。 

iSCSI 使 用 iSCSI Name 来 唯一 鉴别 启动 设备 和 目标 设备 。 地 址 会 随 着 启动 设备 和 目 
标 设备 的 移动 而 改变 ， 但 是 名 字 始 终 是 不 变 的 。 建 立 连 接 时 ， 启 动 设备 发 出 一 个 请 求 ， 
目标 设备 接收 到 请 求 后 ， 确 认 启 动 设 备 发 起 的 请 求 中 所 携带 的 iSCSI Name 是 否 与 目标 
设备 绑 定 的 iSCSI Name 一 致 ， 如 果 一 致 ， 便 建立 通信 连接 。 每 个 iSCSI 节点 只 允许 有 一 
4* iSCSI Name， 一 个 iSCSI Name 可 以 用 来 建立 一 个 启动 设备 到 多 个 目标 设备 的 连接 ， 
多 个 iSCSI Name 可 以 用 来 建立 一 个 目标 设备 到 多 个 启动 设备 的 连接 。 


7.3.5 iSCSI 会话 连接 


iSCSI 协议 的 会 话 就 是 在 网 络 上 封包 和 人 解 包 的 过 程 。 在 网 络 的 一 端 ， 数 据 包 被 封装 
成 TCP/IP $., iSCSI 识别 包 和 SCSI 数据 三 部 分 内 容 。 当 数据 包 被 传输 至 网 络 另 一 端 时 ， 
这 三 部 分 内 容 被 有 序 地 解 封 装 ， 还 原 为 原始 的 SCSI 数据 。iSCSI 会 话 建 立 前 必须 先 建立 
TCP 连接 ， 只 有 TCP 经 过 三 次 握手 建立 起 连接 之 后 ， 才 能 建立 iSCSI 会 话 。 一 个 TCP 
会 话 中 可 以 包含 一 个 或 者 多 个 iSCSI 会 话 。iSCSI 会 话 连接 示意 图 如 图 7-8 所 示 。 
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图 7-8 iSCSI 会话 连接 


iSCSI 会 话 分 为 两 种 ， Discovery 会 话 和 Normal 会话。 

Discovery 会 话 仅 用 于 iSCSI Target discovery 而 建立 的 会 话 。 Normal 会 话 是 无 限制 会 
ii,» iSCSI 无 需 执行 Send Target 命令 发 现 请 求 ，iSCSI Initiator 直接 使 用 iSCSI Target 的 
名 字 来 建立 iSCSI 会 话 ， 会 话 建立 后 可 执行 iSCSI 完整 功能 。 

1. iSCSI 的 Discovery 会 话 

在 建立 iSCSI 会 话 前 需要 先 建立 TCP 连接 ，TCP 连接 通过 三 次 握手 过 程 来 建立 。 而 
Discovery 会 话 的 建立 分 为 三 个 阶段 ,首先 是 Initiator 和 Target 之 间 的 登录 参数 协商 阶段 ， 
Initiator RIX Login Request 报 文 请 求 登 录 , Target 在 收 到 请 求 信息 后 ,返回 Login Response 
报 文 给 Initiator， 同 意 Initiator 登录 ， 从 而 完成 初步 的 登录 协商 。 在 登录 之 后 ， 传 送 数据 
之 前 还 需要 进行 一 次 从 参数 的 协商 ， 这 个 过 程 被 称 为 完整 功能 状态 下 的 参数 协商 。 最 后 
由 Initiator 发 送 Sent Target 命令 请 求 报 文 Text Request, Target 端 收 到 请 求 报 文 以 后 ， 查 
询 到 网 络 中 存在 的 iSCSI 信息 后 ， 发 送 Text Response 报 文 给 Initiator， 并 返回 一 系列 和 
它 相 连 的 iSCSI Target 的 信息 ， 最 终 建立 会 话 。Discovery 会 话 过 程 如 图 7-9 所 示 。 

Initiator Target 

建立 TCP 会 话 (三 次 握手 ) 
















TCR 





Login Request 







Login Response 


Send Target 


图 7-9 Discovery 会 话 


Login Response 


Text Request 


Text Response 


2. iSCSI 的 Normal 会 话 

iSCSI Normal 会 话 分 为 登录 阶段 、 完 整 功能 阶段 、 登 出 阶段 3 部 分 。 

iSCSI 的 登录 阶段 等 同 于 FC 端口 登录 过 程 。 该 过 程 用 来 在 两 个 网 络 实体 间 调 整 各 个 
参数 并 确认 登录 的 访问 权限 。 如 果 iSCSI 登录 阶段 成 功 完成 ， 目 标 设备 将 确认 启动 设备 
的 登录 ， 和 否则 登录 将 不 确认 ， 同 时 TCP 连接 中 断 。 
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登录 一 旦 确认 ,iSCSI 会话 就 进入 完整 功能 阶段 ,如 果 建 立 了 多 个 TCP ER, Ml iSCSI 
要 求 每 个 命令 /响应 对 应 一 个 TCP 连接 。 但 是 ， 不 同 的 数据 传输 可 以 在 一 个 会 话 中 通过 
不 同 的 TCP 连接 。 在 数据 传送 端 ， 启 动 器 发 送 /接收 最 新 的 数据 ， 而 目标 器 在 完成 数据 
传输 后 发 送 确认 响应 。iSCSI 注销 命令 用 来 结束 一 个 会 话 ， 在 出 现 连接 错误 时 也 会 发 送 
它 ， 以 实现 连接 中 断 处 理 。iSCSI 登录 是 用 来 在 启动 设备 和 目标 设备 之 间 建 立 TCP 连接 
的 机 制 。 登 录 的 作用 包括 鉴别 通信 双方 、 协 商会 话 参数 、 打 开 相 关 安 全 协议 并 作为 属于 
该 会 话 的 连接 的 标志 。 
登录 过 程 完成 后 ，iSCSI 会 话 进入 全 功能 状态 (full feature phase)， 这 时 局 动 设备 就 
能 通过 iSCSI 协议 访问 目标 设备 里 的 各 逻辑 单元 了 。 
iSCSI 会 话 拆除 时 ，Initiator 首先 向 Target RIX Logout Request 请 求 报 文 ，Target 接 
收 到 请 求 报 文 后 ， 返 回 相 应 的 Logout Response 报 文 ， 至 此 ，iSCSI 会 话 可 以 拆除 。 在 拆 
除 iSCSI 会话 后 还 需要 拆除 TCP 连接 , 拆除 TCP 连接 是 通过 四 次 握手 来 完成 的 .Normal 
会 话 过 程 如 图 7-10 所 示 。 
Initiator Target 
建立 TCP 会 话 (三 次 握手 ) 
iSCSI 登录 
登录 应 答 
可 选 文本 指令 


iSCSI 驱动 程序 iSCSI 驱动 程序 
其 他 多 次 登录 


登录 应 答 
登录 成 功 ， 进 入 完整 功能 阶段 
7-10 Normal 会 话 





7.3.6 iSCSI 的 拓扑 结构 


iSCSI 的 拓扑 结构 可 分 为 原生 模式 、 桥 接 模 式 和 FC 与 原生 混合 模式 3 类 。 

对 于 支持 iSCSI 的 存储 阵列 ，iSCSI 启动 器 以 直接 或 IP 网 络 的 方式 连接 到 目的 方 。 
启动 器 通过 网 络 可 以 访问 存储 阵列 中 可 用 的 数据 单元 地 址 ， 将 存储 阵列 作为 目标 器 。 这 
种 模式 称 为 原生 模式 。 

当 FC 存储 阵列 已 经 存在 而 阵列 本 身 没 有 原生 的 iSCSI 端口 时 ， 要 实现 iSCSI 启动 
器 和 阵列 的 连接 就 必须 使 用 额外 的 桥接 设备 ， 如 iSCSI 网 关 等 ， 桥 接 器 的 作用 是 实现 IP 
数据 包 与 FC 数据 包 之 间 的 转换 ， 这 种 模式 称 为 桥接 模式 。 与 原生 模式 不 同 ， 桥 接 器 成 
为 了 iSCSI 启动 器 的 目标 器 ， 其 IP 地 址 被 配置 给 启动 器 ， 同 时 桥接 器 也 是 FC 存储 阵列 
的 启动 器 。 

而 对 于 同时 配备 了 iSCSI 和 FC 端口 的 存储 阵列 ， 实 现 IP 与 FC 的 共存 就 不 需要 桥 
接 器 了 ， 这 样 的 阵列 可 以 同时 实现 iSCSI 和 FC 连接 。 这 种 模式 也 可 以 称 为 FC 与 iSCSI 
原生 混合 模式 。 在 实际 应 用 中 ， 这 种 模式 也 最 为 常见 。 
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7.3.7 iSCSI 实现 方式 


iSCSI 设备 通常 使 用 IP 接口 作为 其 主机 接口 ， 并 可 以 通过 与 传统 以 太 网 交换 机 的 连 
接 ， 构 建 一 个 基于 TCP/IP 协议 的 存储 区 域 网 络 。 根 据 主 机 端 采用 的 连接 方式 的 不 同 ， 
iSCSI 设备 与 主机 的 连接 通常 有 3 种 形式 。 

1. 以 太 网 卡 +Initiator 软件 方式 

采用 这 种 方式 的 主机 使 用 标准 的 以 太 网 卡 NIC 与 网 络 连 接 。iSCSI 2A TCP/IP 
协议 栈 功能 通过 主机 CPU 运行 软件 计算 完成 。 由 于 这 种 方式 直接 使 用 传统 主机 系统 通用 
的 NIC 卡 ， 所 以 成 本 最 低 ， 但 是 由 于 需要 占用 CPU 资源 处 理 iSCSI Al TCP/IP 协议 ， 所 
以 导致 主机 系统 性 能 下 降 。 

服务 器 、 工 作 站 等 主机 设备 使 用 标准 的 以 太 网 卡 ， 通 过 以 太 网 线 直接 与 以 太 网 交换 
HLEH, iSCSI 存储 也 通过 以 太 网 线 连 接 到 以 太 网 交换 机 上 ， 或 直接 连接 到 主机 的 以 太 
网 卡 上 。 在 主机 上 安装 Initiator 软件 以 便 将 以 太 网 卡 虚拟 为 iSCSI 卡 ， 用 以 接收 和 发 送 
iSCSI 数据 报 文 , 从 而 实现 主机 和 iSCSI 设备 之 间 的 iSCSI 协议 和 TCP/IP 协议 传输 功能 。 
由 于 采用 普通 的 标准 以 太 网 卡 和 以 太 网 交换 机 ， 无 需 额外 配置 适配器 ， 因 此 此 种 方式 硬 
件 成 本 最 低 。 缺点 是 进行 iSCSI 报 文 和 TCP/IP 报 文 转换 需要 占用 主机 端的 资源 ， 主 机 的 
运行 开销 增加 ， 从 而 导致 系统 性 能 下 降 。 不 过 在 对 VO 和 带宽 性 能 要 求 较 低 的 应 用 环境 
中 基本 能 够 满足 数据 访问 要 求 。 以 太 网 卡 +Initiator 软件 方式 如 图 7-11 所 示 。 


Initiator 软件 完成 


iSCSI 报 文 到 TCP/IP 
报 文 转换 , 需 占用 主 
机 资源 











基于 TCP/IP 协议 
的 以 太 网 连接 









-一 一 ~ 内 部 总 线 连接 
以 太 网 连接 
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7-11 以太 网 卡 +Initiator 软件 方式 


2. TOEHnitiator 软件 方式 

采用 这 种 方式 的 主机 使 用 TCP 卸载 引擎 (TCP offload engine, TOE) 网 卡 ，iSCSI 
协议 的 功能 仍然 由 主机 的 CPU 完成 ，TCP 协议 处 理 则 交 由 TOE 网 卡 完 成 ， 有 效 减 轻 了 
主机 端的 负担 。 

智能 以 太 网 卡 可 以 将 网 络 数据 流量 的 处 理工 作 全 部 转 到 网 卡 上 的 集成 硬件 中 进行 ， 
TCP/IP 协议 栈 功 能 由 TOE 网 卡 完成 ,iSCSI 层 的 功能 仍 由 主机 来 完成 ， 由 此 , 采用 TOE 
网 卡 可 以 大 幅度 提高 数据 的 传输 速率 。 与 纯 软 件 的 方式 相 比 ， 这 种 方式 部 分 降低 了 主机 
系统 的 运行 开销 而 又 不 会 过 多 增加 网 络 构建 成 本 ， 是 一 种 比较 折 中 的 配置 方案 。 智 能 
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TOE 网 卡 +Initiator 软件 方式 如 图 7-12 所 示 。 
Initiator 软件 完成 


iSCSI 层 的 功能 ， 
需 占用 主机 资源 








TCP/IP 协议 转换 由 
TOE 网 卡 完 成 ， 


智能 以 太 网 卡 i 不 占用 主机 资源 







i a a 


基于 TCP/IP 协议 
的 以 太 网 连接 IPSAN 网 络 
-一 一 一 内 部 总 线 连 接 


以 太 网 连接 





存储 设备 
图 7-12 智能 TOE 网 卡 +Initiator 软件 方式 

3. iSCSI HBA 卡 方式 

采用 这 种 方式 的 主机 ， 其 iSCSI 协议 功能 及 TCP/IP 协议 栈 功 能 均 由 iSCSI HBA -F 
完成 ， 占 用 主机 的 开销 最 小 。 

在 主机 上 安装 iSCSI HBA 适 配 卡 ， 从 而 实现 主机 与 交换 机 之 间 、 主 机 与 存储 设备 之 
间 的 高 效 数 据 交 换 。iSCSI 层 和 TCP/IP 协议 栈 的 功能 均 由 主机 总 线 适 配器 (HBA) 完成 ， 
对 主机 CPU 的 占用 最 少 。 这 种 方式 数据 传输 性 能 最 好 , 但 是 系统 构建 价格 也 最 高 iSCSI 
HBA 卡 方式 如 图 7-13 Aras. 





完成 iSCSI 报 文 到 
TCP/IP 报 文 转换 ， 
完全 不 占用 主机 资源 







iSCSI HBA -F & 


IP SAN 网 络 
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图 7-13 iSCSI HBA 卡 方式 





基于 TCP/IP 协议 
的 以 太 网 连接 
-一 一 一 内 部 总 线 连接 
以 太 网 连接 





7.4 FC 协议 与 TCP 协议 的 融合 


在 之 前 的 学 习 中 ， 我 们 知道 FC 协议 与 IP 协议 不 能 直接 连接 ， 影 响 了 FC 网 络 的 易 
用 性 及 其 性 能 。 为 了 解决 这 些 问 题 ， 学 者 们 在 FC-SAN 的 基础 上 又 发 展 出 了 许多 新 的 存 
储 协 议和 标准 。 融 合 使 用 FC 和 IP 两 种 协议 有 很 多 好 处 ， 例 如 : 
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。 降低 成 本 : 融合 的 网 络 可 以 利用 原 有 的 LAN 网 络 进行 传输 ， 大 大 降低 了 全 部 使 
用 FC 设备 的 成 本 。 而 且 能 够 连接 以 前 分 散 的 资源 ， 降 低 管 理 的 开销 。 
。 增强 灵活 性 : 比 起 单一 的 LAN 网 络 和 FC 网 络 ， 融 合 网 络 显然 拥有 更 好 的 灵活 
性 。 现 有 的 各 种 设备 都 能 符合 网 络 的 需要 使 用 ， 大 大 提高 了 系统 的 可 用 性 。 
目前 ，FC 协议 与 以 太 网 的 融合 方式 主要 有 : FCIP、iFCP、FCoE。 这 几 种 方法 使 用 
了 不 同 的 实现 方式 ， 也 有 各 目的 特点 。 下 面 将 逐一 详细 介绍 。 


7.4.1 FCIP 技术 


基于 IP 协议 的 光纤 通道 (fiber channel over IP, FCP) 是 基于 IP 协议 传输 的 光纤 通 
道 数据 帧 的 解决 方案 ， 由 Brocade、Gadzoox、Lucent、McData 以 及 Qlogic 公司 共同 提 
出 。FCIP 这 一 技术 的 核心 是 把 光纤 通道 协议 的 数据 帧 封装 在 IP 数据 包 中 ， 以 便 在 覆盖 
广阔 的 TCP/IP 网 络 中 传递 。 这 种 将 不 同 协议 的 数据 封包 传送 的 技术 叫 作 隧道 (tunneling) 
技术 。 目 标 设备 接收 后 ， 由 专门 的 设备 进行 解 封 来 还 原 FC 数据 帧 。 

FCP 协议 实质 上 就 是 采用 隧道 技术 的 IP-SAN 方案 。 采 用 FCIP 技术 可 以 利用 目前 
HY) IP 网 络 来 连接 两 个 异地 的 FC-SAN， 以 解决 FC-SAN 之 间 的 互 连 问题 。 隧 道 传输 技术 
是 通过 使 用 FCIP 网 关 来 实现 的 ， 所 有 发 往 远程 站 点 的 存储 数据 均 通过 公用 的 IP 隧道 ， 
接收 端的 光纤 通道 交换 机 负责 将 到 来 的 每 个 帧 交换 至 目的 光纤 通道 端点 设备 。 

FCIP 提供 了 在 TCP/IP 协议 中 封装 FC 协议 数据 帧 的 方法 , 消除 了 FC 目前 存在 的 距 
离 限 制 ， 允 许 通 过 P 网 络 来 互 连 FC-SAN， 数 据 的 访问 变 得 更 加 灵活 ， 存 储 策略 的 部 署 
更 加 容易 。FCIP 架构 示意 图 如 图 7-14 所 示 。 


FCIP 网 关 FCIP 网 关 





FC 存储 阵列 FC 存储 阵列 
7-14 FCIP 构架 示意 图 


7.4.2 FCIP 技术 细节 


1. FCIP 的 协议 栈 

FCIP 协议 是 一 个 P2P 的 隧道 封装 协议 。 在 FCIP 的 协议 栈 中 ，FCIP 协议 处 于 FC 和 
TCP 之 间 。 Æ TCP 下 层 是 下 协 议 层 、 数 据 链 路 层 以 及 物理 层 协议 ，FC 协议 的 上 层 则 有 
FCP 和 SCSI 协议 ， 由 此 可 见 FCIP 协议 联系 了 底层 的 IP 网 络 和 高 层 的 SCSI 应 用 ， 实 现 
了 不 同 网 络 、 不 同 协议 之 闻 的 网 络 设备 互 连 和 应 用 的 融合 。FCIP 的 协议 栈 如 图 7-15 所 示 。 
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SCSI 应 用 (文件 系统 、 数 据 库 ) 
SCSI 指令 、 数 据 及 状态 


FCP 
FCIP 
以 太 网 


图 7-15 FCIP 的 协议 栈 





2. FCIP 的 数据 封装 

在 FCIP 数据 封装 中 ，FC 网 络 体 系 结构 提供 的 终端 寻 址 、 地 址 解析 、 信 息 路 由 等 信 
息 均 保持 不 变 ，IP 协议 在 这 里 只 用 来 承载 FC 数据 帧 进行 传输 。 

FCIP 在 FC il TCP 包头 之 间 加 入 了 FCIP 包头 、 版 本 、 帧 长 度 等 字段 。 发 送 端 FCIP 
网 关 设 备 将 FC 封装 为 FCIP 帧 ， 通 过 IP 网 络 传送 。 接 收 端 FCIP 网 关 设 备 接收 到 FCIP 
帧 后 ， 解 封装 IP 和 TCP 报头， 还原 成 FC 帧 并 通过 一 个 或 多 个 FC 交换 机 发 送 到 目的 节 
点 。FCIP 的 数据 封装 模式 如 图 7-16 所 示 。 


| 以 太 网 帧 头 
pe te 
FC 由 
图 7-16 FCIP 的 数据 封装 
3. FCIP 通信 过 程 
FCIP 的 通信 过 程 是 由 数据 引擎 驱动 的 ,首先 在 源 FCIP 连接 端点 (FCIP link end point, 
FCIP LEP) 处 对 FC 协议 数据 帧 进行 封装 ， 然 后 通过 TCP/P 协议 在 IP 网 络 中 传输 ， 到 
iA BAN FCIP 连接 端点 后 进行 解 封装 , 读 出 其 中 的 数据 并 执行 其 中 的 FC 指令 。 其 过 程 如 
7-17 所 示 。 


FCIP LEP FCIP LEP 


' 解 封装 引擎 : 


ee 
a x 


7-17 FCIP 通信 原理 












FC 帧 





74.3 基于 FCIP 的 存储 方案 及 其 特点 
使 用 FCP 构建 的 存储 方案 如 图 7-18 所 示 。 
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FC-SAN FC-SAN 





图 7-18 ”FCIP 存储 方案 

在 用 FCIP 构建 的 IP 存储 方案 中 ，FC 协议 帧 被 封装 进 IP 数据 包 中 传输 ， 当 到 达 远 
端 后 由 专用 设备 解 封 ， 还 原 成 原始 的 FC 协议 帧 。 这 样 可 以 直接 利用 现 有 的 IP 网 络 进行 
传输 ， 充 分 利用 现 有 的 网 络 资源 。 

但 是 FCP 也 存在 一 些 缺 点 。 首 先 ， 由 于 它 使 用 卫 网 络 ， 所 以 带宽 远 低 于 纯 FC。 其 
次 ， 由 于 将 FC 协议 帧 封装 进 了 了 数据 包 中 , 诸如 目录 服务 、 流 量 控制 等 许多 IP 网 络 的 
管理 控制 方式 无 法 应 用 于 FCP, 使 得 其 网 络 的 性 能 和 可 靠 性 受到 影响 。 最 后 , 由 于 FCIP 
只 是 在 TCP/IP 网 络 中 构建 起 一 个 传输 FC 协议 帧 的 隧道 连接 两 个 远 端 的 FC-SAN， 所 以 
在 本 地 仍然 是 FC-SAN。 


7.44 iFCP 技术 


FCP 技术 实际 上 是 一 种 很 不 完善 的 FC 与 TCP 融合 的 方法 ， 受 到 IP 网 络 可 靠 性 和 
性 能 方面 的 双重 制约 。 在 此 基础 上 发 展 出 的 FC 技术 是 另 一 种 网 络 存储 技术 。 

互联 网 光纤 通道 协议 〈Internet fibre channel protocol, iFCP) 技术 直接 为 TCP/IP 网 
络 上 的 光纤 通道 设备 提供 光纤 信道 通信 和 服务， 能够 实现 端 到 端的 IP 连接 。FC 存储 设备 、 
主机 总 线 适 配器 Chost bus adapter, HBA). 交换 机 等 可 以 直接 连接 到 下 CP 网 关上 。iFCP 
使 用 TCP 提供 流量 控制 、 错 误 检测 和 错误 恢复 功能 ， 其 主要 目标 是 使 现 有 的 光纤 信道 设 
备 能 够 在 P 网 络 上 实现 高 速 互 连 与 组 网 。iFCP 及 其 定义 的 帧 地 址 转换 方法 允许 通过 透明 
网 关 将 FC 存储 设备 挂 载 到 基于 TCP/IP 协议 的 网 络 结构 中 。 简 单 地 说 ，iFCP 的 工作 原理 
就 是 : 将 FC SGU IP AAA, FER IP 地 址 映射 到 各 个 FC 设备 上 ， 实 现 直接 交互 。 

iFCP 可 以 直接 替代 FC 架构 ， 通 过 下 CP 存储 交换 机 可 以 直接 连接 FC 的 各 个 设备 并 进 
行 分 组 ， 而 不 是 像 FCIP 那样 直接 对 FC-SAN 进行 远程 连接 。 但 是 证 CP 也 没有 直接 连接 。 

iFCP 技术 的 优势 有 以 下 几 点 。 

C1) 通过 直接 建立 端 到 端的 连接 ， 让 CP 在 遇 到 传输 故障 时 ， 可 以 将 出 现 故障 的 区 域 
隔离 出 来 ， 增 加 网 络 的 可 靠 性 。 

(2) 它 殉 服 了 端 到 端 隧道 的 限制 ， 实 现 了 真正 意义 上 的 互 连 。iFCP 提供 FC 设备 端 
到 端的 连接 ，TCP 连接 的 中 断 只 会 影响 到 其 中 一 对 通信 ， 不 会 影响 到 其 他 通信 ， 也 不 会 
将 一 个 设备 的 错误 传递 给 其 他 设备 。 

(3) iFCP 实现 了 SAN 的 路 由 故障 隔离 、 安 全 及 灵活 管理 ， HAEE FCP 更 高 的 可 靠 
性 ， 其 结构 示意 图 如 图 7-19 所 示 。 
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FC 存储 阵列 FC 存储 阵列 
7-19 iFCP 结构 示意 图 


7.4.5 iFCP 技术 细节 


1. iFCP 协议 栈 

iFCP 协议 位 于 TCP/IP 协议 和 FC 协议 之 间 ， 可 以 起 到 连接 这 两 种 协议 网 络 的 作用 。 
iFCP 协议 层 的 主要 功能 是 在 本 地 和 远程 N PORT 间 传 输 光 纤 通 道 帧 。 当 帧 被 传输 到 远 
程 N PORT 时 ，iFCP 层 开 始 封装 光纤 通道 帧 。 光 纤 通 道 帧 包括 每 一 个 光纤 通道 信息 单 
元 ， 通 过 预先 建立 的 TCP 连接 在 IP 网 络 上 传输 。iFCP 协议 栈 示意 图 如 图 7-20 所 示 。 


SCSI 应 用 〈 文 件 系统 、 数 据 库 ) 
SCSI 指令 、 数 据 及 状态 








图 7-20 iFCP 协议 栈 


2. 下 CP 协议 封装 
iFCP 在 FC 帧 和 TCP 包头 之 间 ， 在 FCP EH, FC 设备 的 24 位 fabric 地 址 被 映射 
到 一 个 唯一 的 卫 地 址 上 ,为 Fibre Channel 启动 器 和 目标 提供 了 本 地 IP 地 址 的 编 址 工作 。 


iFCP 代替 了 Fibre Channel 的 底层 传输 层 


(FC-2), 它 使 用 TCP/IP 在 卫 网络 上 进行 
可 靠 传 输 。 下 CP 协议 封装 示意 图 如 图 7-21 
D ID:01 
2 
图 7-21 还 CP 协议 封装 示意 图 


PEFR o 

3. iFCP 的 通信 过 程 

使 用 iFCP 进行 通信 的 过 程 如 下 : 首 
先 将 FC 数据 以 IP 包 形 式 封装 ， 并 将 IP 
地 址 映射 到 分 离 光 纤 通 道 设 备 。 由 于 在 人 P 网 中 ， 每 类 FC 设备 都 有 其 独特 标识 ， 它 能 够 
与 位 于 IP 网 其 他 节点 的 设备 单独 收发 存储 数据 。 光 纤 通 道 信 号 在 下 CP 网 关 处 终止 ， 信 
号 转换 后 ， 数 据 传输 在 IP 网 中 进行 。 这 样 下 CP 打破 了 传统 FC 网 络 10km 距离 的 限制 。 


D_IP:01x x X X 
S IP:02x X X X 
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iFCP 工作 原理 示意 图 如 图 7-22 所 示 。 
(2 SE ee Te aS eee SS 
rome || rcas | rus | 








图 7-22 iFCP 协议 通信 流程 示意 图 


7.4.6 ”基于 iFCP 的 存储 方案 


在 使 用 下 CP 协议 构建 的 了 了 -SAN 存储 网 络 中 ，iFCP 存储 交换 机 直接 替代 FC-SAN 
中 的 光纤 通道 交换 机 ， 由 此 可 知 ，iFCP 交换 机 也 具有 SNS (存储 名 称 服务 器 ) DORE, BE 


够 为 终端 节 扣 提供 名 称 发 现 服务 。 


iFCP 交换 机 分 配 4 字 节 的 IP 地 址 给 每 一 个 光纤 通道 终端 。 当 光纤 通道 设备 发 送 一 
个 SNS 名 称 查询 时 ， 这 个 请 求 首先 发 送 给 下 CP 交换 机 ， 并 由 ISNS 服务 器 进行 解释 。 在 
光纤 通道 层 ， 一 个 适用 的 目标 地 址 表 将 返回 给 发 起 者 , 此 时 其 余 P 的 光纤 通道 地 址 表 映 


射 光纤 通道 地 址 ， 以 便 相应 的 IP 地 址 可 以 通过 IP 网 络 传 到 目标 设备 。 
iFCP 网 络 体系 架构 如 图 7-23 所 示 。 
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图 7-23 iFCP 网 络 体系 架构 
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7.4.7 FCoE 技术 


FCoE 技术 是 近来 配合 10GB 以 太 网 发 展 出 的 一 种 新 技术 。 从 FC 的 角度 上 看 , FCoE 
就 是 直接 在 LAN 上 运行 FC 协议 。 

FCoE 技术 标准 最 早 在 2007 年 由 多 家 IT 厂商 向 美国 国家 标准 协会 (ANSI) T11 Æ 
员 会 提交 。 通 过 该 技术 标准 可 以 将 光纤 通道 映射 到 以 太 网 ， 将 光纤 通道 信息 插入 以 太 信 
息 包 内 ， 让 服务 器 至 FC-SAN 存储 设备 的 光纤 通道 请 求 和 数据 可 以 通过 以 太 网 连接 来 传 
输 ， 实 现在 以 太 网 上 传输 FC-SAN 数据 。FCoE 允许 在 一 根 通信 线 绕 上 传输 LAN 和 
FC-SAN 通信 ， 融 合 网 络 可 以 支持 LAN 和 SAN 数据 类 型 ， 减 少数 据 中 心 设备 和 线 缆 数 
量 ， 并 降低 供电 和 制冷 负载 ， 提 高 数据 中 心 的 能 效 比 。 


7.4.8 FCoE 技术 细节 


1. FCoE 协议 栈 
如 前 所 述 ，FCoE 就 是 把 FC-2 层 以 上 的 内 容 直接 封装 到 以 太 网 报 文中 进行 承载 。 协 
议 栈 如 图 7-24 所 示 ， 上 层 是 FC 结构 ， 底 层 是 以 太 网 结构 。 





图 7-24 FCoE 协议 栈 


2. FCoE 协议 封装 
FCoE 在 封装 时 ， 将 FC 帧 完整 地 包含 在 以 太 网 帧 的 内 部 。 其 中 ， 以 太 网 帧 头 和 FC 
帧 部 分 完全 没有 变化 ，FCoE 的 控制 信息 等 部 分 包含 在 FCoE mK, BA 7-25 所 示 。 


7-25 FCoE 报 文 封装 


7.4.9 基于 FCoE 的 存储 方案 及 其 特点 


要 部 署 FCoE， 实 现 LAN、SAN 的 统一 交换 ， 需 要 解决 网 络 融合 后 带 来 的 新 问题 
多 业务 融合 后 的 大 带宽 需求 和 基于 业务 的 流量 控制 需求 。 

对 于 带宽 需求 方面 ， 多 业务 融合 后 ， 服 务 器 如 果 沿 用 传统 的 GE 网 卡 ， 无 法 负载 大 
带宽 业务 ， 需 要 通过 升级 服务 器 至 高 速 网 卡 和 高 速 交 换 网 络 来 解决 。 

对 于 基于 业务 的 流量 控制 方面 ,存储 业务 在 网 络 中 传输 要 求 做 到 无 丢 包 , 在 传统 
FC-SAN 的 网 络 中 有 相应 的 监控 机 制 。 而 传统 的 以 太 网 缺少 类 似 的 端 到 端 流 控 机 制 ， 
无 法 保证 传输 中 无 丢 包 ， 需 要 以 太 网 引入 相应 的 机 制 ， 保 证 高 优先 级 业务 的 无 丢 包 
传输 。 
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目前 已 有 IEEE 提出 的 数据 中 心 桥接 技术 (data center bridging, DCB) 来 解决 业务 
的 控制 需求 , 主要 包含 基于 优先 级 的 流 控 功 能 (IEEE 802.1Qbb priority-based flow control， 
PFC) 和 基于 优先 级 的 增强 传输 选择 及 数据 中 心 桥 能 力 交 换 协 议 (IEEE 802.1Qaz 
enhanced transmission selection and data center bridging eXchange, ETS & DCBX)。 通过 这 
些 协 议和 功能 ， 以 太 网 能 够 得 到 传统 FC 中 的 传输 参数 协商 、 发 生 拥 塞 时 端 到 端的 拥塞 
通知 ， 以 及 基于 不 同 优先 级 业务 的 处 理 和 分 发 能 力 。 

华为 最 新 的 云 存 储 产 品 (Huawei Converged Fabric) 就 采用 了 FCoE 架构 ， 其 结构 如 
7-26 所 示 。 


Storage Array 







集中 式 FCoE 
网 关 





Mg 
a 
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图 7-26 “华为 融合 云 网 络 方案 


7.5 IP-SAN 协议 的 比较 


7.5.1 FC/iFCP/FCIP 协议 


回顾 一 下 已 经 学 过 的 协议 。 

上 一 章 介 绍 了 FC 协议 。FC 是 一 种 速度 快 、 价 格 高 ， 但 不 适合 长 途 传输 的 协议 ， 主 
要 适合 于 大 型 的 数据 中 心 。FC 具有 最 长 10km 的 距离 限制 ， 而 且 其 价格 令 人 望而却步 。 
这 两 点 使 得 低 端 用 户 不 得 不 放弃 使 用 FC-SAN。 

但 是 FC 网 络 也 有 很 多 优点 。 首 先 就 是 其 高 速 传输 的 能 力 。 除 此 之 外 ， 与 相对 而 言 
不 太 可 靠 的 IP 协议 相 比 ，FC 具有 相当 高 的 可 靠 性 。 这 些 特点 使 得 研究 者 们 尝试 将 FC 
与 IP 相 结 合 ， 创 造 了 诸如 FCIP、ifCP 等 协议 。 

这 几 个 协议 都 使 用 了 SCSI 指令 库 ， 从 协议 栈 上 可 以 清楚 地 看 到 这 几 种 协议 的 异同 ， 
如 图 7-27 所 示 。 

回 到 IP-SAN 上 来 ，IP-SAN 的 概念 是 伴随 着 iSCSI 的 提出 产生 的 。 在 7.3 小 节 中 我 
们 知道 ，iSCSI 结合 了 IP 和 SCSI 两 种 协议 ， 将 SCSI 命令 封装 在 TCP/IP 包 中 传输 。 
iSCSI 最 大 的 特点 就 是 不 需要 用 其 他 特殊 硬件 。 由 于 P 网 络 已 经 普及 ，iSCSI MAAK 
便宜 ， 还 可 以 充分 利用 闲置 的 网 络 资源 。 
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SCSI WFR MAAS. BGR) 
SCSI 指令 、 数 据 及 状态 






7-27 对 比 几 种 协议 的 协议 栈 


与 之 相 比 ，FCIP 和 下 CP 其 实 是 远 距离 设置 FC-SAN 的 解决 方案 。 例 如 FCIP， 通 过 
将 FC 帧 封装 在 IP 协议 中 传输 , 实现 了 远程 FC-SAN 之 间 的 数据 交换 。iFCP 实际 上 是 对 
FCIP 的 一 种 升级 和 补充 。 


7.5.2 ”分析 与 应 用 场景 


显然 ， 这 些 协 议 各 自 的 特性 决定 了 它们 应 用 上 的 差异 。 

iSCSI 最 大 优点 就 是 价格 便宜 且 不 需要 特殊 设备 。 在 进行 iSCSI 传输 时 ， 封 装 和 解 
封 会 消耗 相当 一 部 分 系统 资源 ， 再 加 上 本 来 P 网 络 的 限制 ，iSCSI 的 传输 带宽 一 般 都 与 
Gb 级 的 FC 相差 甚 远 。 不 过 ， 近 几 年 随 着 10GbiSCSI 标准 的 推广 ，iSCSI 的 性 价 比 再 一 
次 得 以 飞跃 。 也 许 在 不 久 的 将 来 我 们 就 可 以 看 到 iSCSI 能 够 取代 光纤 ， 应 用 于 大 规模 企 
业 级 的 存储 网 络 。 

WE, FCoE JÆ iSCSI 的 主要 竞争 对 手 。FCoE， 即 所 谓 的 以 太 网 光纤 通道 ， 使 
用 以 太 网 作为 传输 介质 的 同时 保有 了 FC 的 协议 结构 ， 是 专门 为 对 低 延 迟 性 和 性 能 要 求 
很 高 的 数据 中 心 网 络 所 设计 的 网 络 协议 。 

iFCP 一 般 用 来 连接 两 个 远程 FC-SAN， 而 iSCSI 是 用 来 实现 本 地 存储 网 络 的 一 种 方 
案 ， 这 两 者 可 以 相互 补充 。 

在 组 网 中 ， 应 当 通 过 实际 情况 分 析 需 要 使 用 的 协议 ， 具 体 请 参考 第 6 章 和 第 7 章 华 
为 产品 的 解决 方案 。 


7.6 IP-SAN 华为 的 实现 与 应 用 


7.6.1 相关 华为 产品 简介 


依然 以 华为 Oceanstor V3 系列 为 例 。 华 为 Oceanstor 5600 V3 背面 图 如 图 7-28 所 示 。 
图 中 可 看 出 其 支持 iSCSI 和 FC 等 多 种 连接 方式 。 

其 iSCSI 模块 如 图 7-29 所 示 。 

其 中 ，1GB iSCSI 接口 模块 提供 了 应 用 服务 器 与 存储 系统 的 业务 接口 ， 用 于 接收 应 
用 服务 器 发 出 的 数据 读 写 指令 ,1GB iSCSI 接口 模块 提供 4 个 传输 速率 为 1Gbit/s 的 i1SCSI 
接口 用 于 接收 应 用 服务 器 发 出 的 数据 交换 命令 。 
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模块 拉手 


GE 电 端 口 GE 电 端 口 Speed 指示 灯 


GE 电 端 口 link/active 指示 灯 





图 7-29 ”华为 Oceanstor 5500 V3 iSCSI 接口 模块 


7.6.2 IP-SAN 解决 方案 


l. 热点 数据 分 级 存储 

在 媒体 、 网 站 等 应 用 中 ， 经 常 产生 高 频 访 问 的 数据 ， 即 热点 数据 。 热 点 数据 由 于 需 
要 频繁 读 写 ， 会 影响 整个 网 络 性 能 。 

OceanStor 5000 V3 产品 通过 SmartTier (智能 数据 分 级 技术 ) 识别 热点 数据 ， 并 将 其 
向 更 高 性 能 的 SAS 或 SSD 硬盘 迁移 ， 提 升 热点 数据 的 存储 性 能 。 一 段 时 间 后 ，SmartTier 
如 果 发 现 热点 数据 的 热度 下 降 ， 就 将 其 向 低 性 能 硬盘 迁移 ， 为 其 他 热点 数据 空 出 存储 空 
间 ， 如 图 7-30 所 示 。 

2. 多 业务 应 用 场景 

当前 不 同类 型 业务 集中 存储 的 需求 越 来 越 多 ， 而 不 同类 型 的 业务 对 存储 的 需求 也 不 
尽 相 同 ， 这 就 需要 存储 系统 在 性 能 和 组 网 方面 具备 高 度 的 灵活 性 ， 以 适应 不 同 的 业务 

OceanStor 5000 V3 系列 能 够 灵活 配置 FC、iSCSI、TOE 和 FCoE 接口 模块 ， 适 应 各 
种 组 网 类 型 和 高 、 中 、 低 不 同 速率 的 网 络 ， 从 而 为 不 同 组 网 下 的 各 种 业务 提供 服务 ， 如 
7-31 PAN. 
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< 一 -> 数据 流向 
图 7-31 华为 Oceanstor 5500 V3 多 业务 应 用 场景 


3. 高 密度 虚拟 机 的 应 用 

虚拟 机 技术 由 于 可 以 大 幅度 提升 应 用 服务 器 的 利用 率 ， 降低 业务 的 部 署 和 运营 成 
本 ， 因 此 在 各 种 领域 的 应 用 越 来 越 广泛 。 随 着 大 量 非 核心 应 用 系统 以 及 虚拟 桌面 被 部 署 
到 虚拟 机 中 ， 虚 拟 机 密度 越 来 越 高 。 高 密度 虚拟 机 所 产生 的 业务 数据 较 单 台 服 务 器 会 增 


peal 













高 性 能 层 硬盘 
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加 数 倍 或 更 多 ， 消 耗 的 数据 带宽 也 会 成 倍增 加 ， 因 此 对 存储 系统 的 容量 、 性 能 和 扩展 性 
也 提出 越 来 越 高 的 要 求 。 

OceanStor 5000 V3 系列 能 够 在 性 能 和 部 署 方 面 满足 高 密度 虚拟 机 应 用 的 需求 : 具有 
三 级 性 能 加 速 技 术 , 能 够 为 高 密度 虚拟 机 应 用 提供 出 色 的 存储 性 能 支持 , 如 图 7-32 所 示 。 













Citrix Xen 
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图 7-32 ”华为 Oceanstor 5500 V3 高 密度 虚拟 机 应 用 


77 本 章 总 结 


通过 本 章 的 学 习 ， 应 当 能 够 回答 下 面 的 问题 。 

。 IP-SAN 网 络 由 哪些 部 分 组 成 ? 简 述 IP-SAN 技术 的 发 展 过 程 。 
IP-SAN 网 络 中 有 哪些 端口 ， 分 别 有 什 么 功能 ? 

iSCSI 是 什么 ? 简单 描述 iSCSI 协议 是 怎样 实现 的 。 

FCIP 和 下 CP 技术 有 什么 异同 ? 

对 于 本 章 中 介绍 的 每 种 协议 ， 用 几 句 话 介绍 它们 的 优点 和 缺点 。 


7.8 练习 题 


一 、 选 择 题 
1， 以 下 可 实现 IP-SAN 的 协议 是 〈 Js 
A. IPFC B. FCIP C. iFCP D. iSCSI 


答案 (BCD) 
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2. 以 下 不 是 IP-SAN 所 具备 的 优势 是 ( Je 

A. 构建 成 本 低 B. 传输 距离 远 C. 带宽 较 高 D. 传输 效率 高 
答案 (D) 
3. iSCSI 协议 介 于 ¢ y Z 

A. IP 4 SCSI B. FC SCSI C. TCP 5 SCSI D. LAWS SCSI 
ES (C) 
4. 以 下 iSCSI 数据 包 封 装 正确 的 是 ( J 


A. SCSI-iSCSI-IP B. IP-SCSI-iSCSI 
C. SCSI-IP-iSCSI D. iSCSI-IP-SCSI 
答案 (A) 
5. iSCSI 的 无 限制 会 话 是 ( P 
A. Login 会 话 B. Normal 会 话 C. 2WAY 会 话 D. Discovery 会 话 
答案 (B) 


6. 以 下 实现 iSCSI 连接 的 方式 中 ， 效 率 最 高 的 是 〈 a 
A. 以 太 网 卡 +Initiator 软件 实现 方式 
B. TOE 网 卡 十 Initiator 软件 方式 
C. iSCSI HBA 卡 实现 方式 
D. FC HBA 实现 方式 


答案 (C) 
7. 以 下 完全 不 包含 FC 信息 的 IP-SAN 协议 是 ( Je 

A. iSCSI B. FCIP C. iFCP D. FCoE 
答案 (A) 


8. A TCP/IP 网 络 上 的 光纤 通道 设备 提供 光纤 信道 通信 服务 ， 以 实现 光纤 通道 设备 
端 到 端的 IP 连接 的 IP-SAN 协议 是 Jo 
A. iSCSI B. FCoE C. FCIP D. iFCP 
答案 (D) 


二 、 简 答题 
iSCSI 的 实现 方式 有 哪 几 种 ? 说 明 它 们 各 自 的 特点 。 


8.1 
8.2 
8.3 
8.4 
8.5 
8.6 
8.7 
8.8 
8.9 





NAS 概 述 
NAS 系 统 组 成 与 部 件 
NAS 文 件 系统 |/O 与 性 能 
NAS 技 术 

NAS 解 决 方案 
NAS 与 SAN 的 比较 

华为 NAS 产 品 实现 与 应 用 
本 章 总 结 

练习 题 





关于 本 章 


本 章 主要 介绍 网 络 附加 存储 (network attached storage，NAS ) 的 相关 知识 ， 包 括 NAS 的 
基本 概念 、NAS 的 演化 和 发 展 、NAS 的 工作 原理 以 及 NAS 的 应 用 。 通 过 本 章 的 学 习 ， 和 希望 读 
者 能 了 解 NAS 的 基本 架构 。 

本 章 将 从 NAS 的 产生 与 发 展 、NAS 系 统 组 成 与 部 件 、NAS 文 件 系 统 与 I0 性 能 、NAS 技 
术 、NAS 解 决 方案 等 方面 对 NAS 进 行 讲 解 。 此 外 ， 结 合 前 一 章 关 于 SAN 的 内 容 ， 对 NAS 和 
SAN 进 行 比较 与 总 结 ， 并 在 最 后 介绍 华为 的 相关 产品 。 
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8.1 NAS 概述 


8.1.1 NAS 的 定义 


网 络 附加 存储 (network attached atorage, NAS) 是 一 种 将 分 布 、 独 立 的 数据 整合 为 
大 型 、 集 中 化 管理 的 数据 中 心 , 以 便于 不 同 主机 和 应 用 服务 器 进行 访问 的 技术 ,通常 NAS 
被 定义 为 一 种 特殊 的 专用 文件 存储 服务 器 ， 包 括 存 储 设备 (如 磁盘 阵列 、CD/DVD 驱动 
器 、 磁 带 驱 动 器 或 可 移动 的 存储 介质 ) 和 内 髓 系统 软件 ， 可 提供 跨 平 台 文件 共享 功能 。 


8.1.2 NAS 的 产生 与 发 展 


NAS 的 出 现 与 网 络 的 发 展 密 不 可 分 ，Internet 的 雏形 ARPANET 出 现 后 ， 现 代 网 络 
技术 得 到 了 迅猛 的 发 展 ， 人 们 在 网 络 中 共享 数据 的 需求 越 来 越 多 。 但 是 在 网 络 中 共享 文 
件 面临 着 跨 平 台 访 问 和 数据 安全 等 诸多 问题 。 早 期 的 网 络 共享 示意 图 如 图 8-1 所 示 。 








数据 C、D 存放 在 用 户 
工作 站 中 进行 共享 


A 
数据 A、B 存放 在 用 户 = 
工作 站 中 进行 共享 = A 


ao 
人 水 a 





8-1 早期 的 网 络 共享 示意 图 


为 了 解决 这 个 问题 ， 可 以 设置 一 台 专 门 的 计算 机 来 保存 大 量 的 共享 文件 ， 这 台 计 算 
机 连接 到 现 有 的 网 络 上 ， 并 人 允许 整个 网 络 上 的 所 有 用 户 共享 其 存储 空间 。 正 是 通过 这 种 
办 法 ， 早 期 的 UNIX 网 络 环境 演化 为 依赖 “文件 服务 器 ”共享 数据 的 方式 。 

使 用 专门 的 服务 器 来 提供 共享 数据 存储 ， 拥 有 大 量 的 存储 磁盘 空间 ， 保 证 数据 的 安 
全 可 靠 是 必须 的 。 同 时 ， 单 台 服 务 器 承担 着 众多 服务 器 的 访问 需求 ， 需 要 对 文件 共享 服 
务 器 进行 文件 VO 方面 的 优化 。 除 此 之 外 ， 操 作 系 统 的 额外 开销 是 不 必要 的 。 因 此 ， 在 
这 种 方式 下 使 用 的 计算 机 应 当 配 有 只 具备 IO 功能 的 “ 瘦 ” 操 作 系统 连接 到 现 有 的 网 络 
中 ， 除 此 以 外 的 功能 ， 都 不 是 这 类 型 服务 器 必需 的 。 网 络 中 的 用 户 能 够 像 访问 目 己 工作 
站 上 的 文件 一 样 访问 这 台 特 殊 服 务 器 上 的 文件 ， 从 根本 上 实现 整个 网 络 中 所 有 用 户 对 文 
件 共 享 的 需求 。 早 期 UNIX 环境 下 的 TCP/IP 网 络 示 意图 如 图 8-2 Aras. 
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数据 A、B、C、D 存放 在 专用 
eee, 






图 8-2 早期 UNIX 环境 下 的 TCP/IP 网 络 示意 图 


随 着 网 络 的 发 展 ， 网 络 中 不 同 计算 机 间 的 数据 共享 需求 越 来 越 多 。 大 多 数 情况 下 ， 人 
们 希望 网 络 中 的 系统 和 用 户 可 以 连接 到 特定 的 文件 系统 并 访问 数据 , 从 而 可 以 像 处 理 本 地 操 
作 系 统 中 的 本 地 文件 那样 来 处 理 来 自 共享 计算 机 的 远程 文件 , 进而 可 以 为 用 户 提供 一 个 虚拟 
的 文件 集合 , 这 个 集合 中 的 文件 并 不 存在 于 本 地 计算 机 的 存储 设备 中 , 其 位 置 实际 上 是 虚拟 
的 。 这 种 存储 方式 的 发 展 方向 之 一 就 是 与 支持 Windows 操作 系统 的 传统 客户 机 /服务 器 环境 
相 集成 。 这 涉及 诸如 Windows 的 网 络 能 力 、 专 用 协议 以 及 基于 UNIX 的 数据 库 服务 器 等 问 
题 。 在 最 初 的 发 展 阶段 中 ，Windows 网 络 由 一 种 至 今 仍 在 使 用 的 网 络 文件 服务 器 组 成 ， 并 
且 使 用 一 种 专用 的 网 络 系统 协议 。 早 期 的 Windows 文件 服务 器 示意 图 如 图 8-3 所 示 。 


Microsoft 网 络 服务 器 上 
的 磁盘 Z 存储 共享 文件 





客户 机 在 登录 系统 后 可 以 
访问 磁盘 Z 上 的 共享 文件 


图 8-3 ”早期 的 Windows 文件 服务 器 


文件 共享 服务 器 的 出 现 使 数据 存储 趋 于 向 集中 式 存 储 发 展 ， 这 种 趋势 使 得 集中 的 数 
据 和 业务 量 也 飞速 增长 。 因 此 ， 专 注 于 文件 共享 服务 的 NAS 产品 应 运 而 生 。 

NAS 通常 在 一 个 LAN 上 拥有 自己 的 节点 ， 无 需 应 用 服务 器 的 干涉 ，NAS 允许 用 户 
通过 网 络 直 接 存 取 文 件数 据 ， 在 这 种 配置 中 ，NAS 将 集中 管理 和 处 理 网 络 上 的 所 有 共享 
文件 ， 将 负载 从 应 用 或 企业 服务 器 上 释放 出 来 ， 有 效 降 低 总 体 拥有 成 本 (total cost of 
ownership，TCO)， 保 护 了 用 户 的 投资 。 简 单 来 说 ，NAS 设备 就 是 连接 在 网 络 上 ， 具 备 


168 信息 存储 与 IT 管理 


文件 存储 功能 的 设备 ， 因 此 也 称 为 “网 络 文件 存储 设备 ”。 它 是 一 种 专用 文件 数据 存储 服 
务 器 ， 以 文件 为 核心 ， 实 现 了 集中 文件 存储 与 管理 ， 将 存储 设备 与 服务 器 彻 确 分 离 ， 从 
而 释放 带宽 ， 提 高 性 能 ， 保 护 了 用 户 的 投资 ， 并 降低 TCO. 

从 本 质 上 讲 ，NAS 是 存储 设备 而 不 是 服务 器 。NAS 不 是 精简 版 的 文件 服务 器 ， 它 
具有 某 些 服务 器 没有 的 功能 特性 。 服 务 器 的 作用 是 处 理 业 务 ， 存 储 设备 的 作用 是 存储 数 
据 ， 在 一 个 完整 的 应 用 环境 中 应 将 两 种 设备 有 机 地 结合 起 来 使 用 。 

NAS 的 内 在 价值 在 于 其 拥有 利用 数据 中 心中 现 有 的 资源 ， 以 快速 且 低 成 本 的 方式 提供 
文件 存储 服务 的 能 力 。 现 在 的 解决 方案 可 以 在 UNIX, Linux 以 及 Windows 环境 之 间 实 现 兼 
容 , 并 且 能 够 轻易 提供 与 用 户 的 TCP/IP 网 络 相 连接 的 能 力 。 NAS 系统 示意 图 如 图 8-4 所 示 。 


Linux/Unix 用 户 Windows 用 户 






Det ee etn er eT TCPAP 网 络 


文件 服务 器 应 用 服务 器 NAS 存储 设备 
8-4 NAS 系统 示意 图 


早期 的 NAS 存储 设备 是 基于 UNIX 的 ， 广泛 应 用 于 学 术 研 究 、 科 学 计算 和 计算 机 
科学 方面 的 研发 中 。 早 期 的 存储 设备 部 署 方式 不 够 灵活 ， 无 法 将 存储 资源 有 效 地 加 以 利 
用 与 管理 。 在 一 些 大 型 系统 中 ， 大 容量 的 存储 设备 不 能 得 到 充分 的 利用 ; 另 一 方面 ， 在 
一 些小 型 系统 中 ， 存 储 设 备 不 能 提供 足够 的 存储 空间 来 储存 大 量 的 数据 。 为 了 解决 这 个 
问题 , 一 种 解决 方案 被 提出 ,这 就 是 使 用 NAS 存储 设备 来 存储 这 些 巨 大 的 文件 ， 并 实现 
该 文件 在 网 络 中 的 共享 。 早 期 NAS 应 用 示意 图 如 图 8-5 所 示 。 

地 理 信息 研究 主 营 。 ”地 理 信息 研究 员 。 ” 地 理 信息 分 析 师 
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文件 服务 器 A 文件 服务 器 B 网 络 连接 存储 设备 
直接 连接 存储 ,80GB 容量 直接 连接 存储 ,60GB 容量 500GB 容量 


8-5 早期 NAS 应 用 示意 图 
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8.2 NAS 系统 组 成 与 部 件 


-8.2.1 NAS 的 组 成 


NAS 设备 通常 具有 计算 机 的 基本 结构 ， 如 磁盘 、RAM 以 及 处 理 器 等 。 因 此 NAS 可 
以 不 依靠 计算 机 而 独立 地 工作 。NAS 设备 能 够 安装 操作 系统 ,一 般 来 说 ,NAS 安装 的 是 
实时 操作 系统 (real-time operating system ， 
RTOS)，RTOS 是 一 种 特殊 的 操作 系统 ， 这 一 类 
的 操作 系统 专门 为 一 些 特定 的 任务 设计 ， 能 够 提 
供 一 些 经 过 优化 的 、 高 效 的 系统 服务 。 例 如 ， 针 
对 NAS，RTOS 可 以 提供 高 效 的 文件 管理 功能 并 
具备 高 效 的 IO 能 力 ， 当 然 ，NAS 也 能 够 安装 普 
通 的 操作 系统 。 通 过 操作 系统 ，NAS 设备 能 够 轻 
松 地 与 用 户 的 TCP/IP 网 络 相 连接 。 此 外 ， 对 于 
基于 UNIX/Linux 的 NFS 以 及 基于 Windows 的 
CIFS, NAS 设备 允许 这 两 种 文件 系统 同时 对 其 进 存储 设备 
行 访问 。NAS 组 成 示意 图 如 图 8-6 所 示 。 8-6 NAS 组 成 示意 图 


8.2.2 NAS 的 硬件 结构 


NAS 的 硬件 可 以 分 为 核心 控制 部 分 和 存储 子 系统 两 部 分 ， 前 者 主要 包括 处 理 器 、 内 
存 、 网 络 适配器 和 磁盘 接口 ， 后 者 通常 使 用 磁盘 阵列 。 

Æ NAS 中 ， 有 大 量 的 数据 需要 通过 网 络 与 其 他 计算 机 交换 ， 因 此 ， 多 数 的 NAS 设 
v” 备 配备 了 于 兆 以 太 网 卡 接口 ， 同 时 采用 多 个 网 卡 链 路 聚集 乃至 多 台 NAS 设备 集群 等 技 
术 ， 从 而 充分 利用 处 理 器 的 计算 能 力 以 及 系统 的 总 线 带 宽 ， 以 获得 极 高 的 吞吐 率 。NAS 
磁盘 接口 一 般 选用 IDE、SCSI 或 光纤 通道 。 

NAS 的 存储 子 系统 中 的 存储 设备 通常 使 用 磁盘 阵列 , 这 样 能 够 存储 大 量 的 数据 以 及 
` 获得 较 高 的 IO RER, 也 可 以 利用 磁盘 阵列 的 元 余数 据 增加 NAS 的 数据 安全 性 与 可 靠 
性 。 此 外 ， 目 前 也 有 少量 的 NAS 服务 器 会 使 用 磁带 库 或 者 光盘 库 作 为 额外 的 存储 设备 。 
NAS 的 基本 硬件 结构 如 图 8-7 所 示 。 

NAS 设备 上 有 一 个 或 多 个 网 络 接口 卡 .NAS 设备 通过 网 卡 与 LAN 相连 ,再 通过 LAN 
与 客户 机 或 网 络 上 的 其 他 服务 器 相连 。 由 于 NAS 设备 与 外 界 的 所 有 通信 都 经 过 网 卡 , 为 
了 不 让 网 络 接口 成 为 新 的 系统 瓶颈 ，NAS 设备 应 采用 高 速 网 卡 ， 甚 至 可 以 采用 多 网 卡 。 
NAS 系统 的 网 络 接 口 应 满足 高 峰 时 期 系统 对 NAS 网 络 带 宽 的 需求 。 

NAS 设备 与 存储 子 系 统 的 接口 可 以 是 IDE、SCSI、SAS 或 FC， 这 些 接口 的 带宽 也 
会 影响 系统 的 性 能 。NAS 设备 应 有 足够 的 IO RAR VO 通道 处 理 速度 与 带宽 ， 以 便 应 
对 网 络 系统 高 峰 时 的 用 户 需 求 。 

NAS 设备 与 存储 子 系统 的 接口 也 影响 它 的 存储 容量 。 一 个 IDE 接口 只 能 连接 2 RE 
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盘 ， 一 条 SCSI 总 线 可 以 连接 16 块 硬 盘 ， 一 个 SAS 或 者 FC 通道 可 以 连接 SAN 并 进而 
连接 无 数 块 硬盘 。 如 果 NAS 设备 通过 SAS 或 者 FC 通道 与 SAN 连接 ， 则 NAS 设备 同 
时 又 是 SAN 架构 中 的 一 个 主机 系统 。 


NAS 设备 


IDE:33/66/100MB/s ! 
SCSI:40/80/160MB/s! 

| FC:100/200/MB/s ， 
J 





客户 机 客户 机 
图 8-7 NAS 的 基本 硬件 结构 


8.2.3 NAS 的 软件 组 成 


NAS 要 求 能 够 实现 大 量 数据 的 存储 与 备份 , 在 此 基础 上 还 需要 提供 稳定 而 高 效 的 数 
据 传 输 服务 ， 这 样 的 要 求 仅 仅 依 靠 硬件 是 无 法 完成 的 NAS 还 需要 一 定 的 软件 来 实现 这 
样 的 要 求 。NAS 的 软件 按照 功能 可 以 划分 为 操作 系统 、 卷 管理 器 、 文 件 系 统 、 网 络 文件 
共享 和 Web 管理 5 个 模块 ， 如 图 8-8 所 示 。 


网 络 文件 共享 
(NFS, CIFS) 


NAS 硬件 
X86CPU、 网 卡 、SCSI 卡 、 热 插 拔 硬盘 


8-8 NAS 的 基本 软件 结构 





1. 操作 系统 
NAS 通常 采用 32 位 或 者 64 位 的 UNIX/Linux 或 Windows 操作 系统 ,NAS 的 操作 系 
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统 针 对 NAS 的 功能 以 及 硬件 条 件 进行 了 独 有 的 设计 与 优化 ， 从 而 保证 NAS 能 够 更 加 高 
效 地 运行 。NAS 的 操作 系统 通常 具备 高 度 稳定 性 的 内 核 并 支持 多 线程 与 多 任务 操作 ， 这 
样 的 设计 在 确保 NAS 系统 安全 稳定 的 基础 上 ， 提 供 了 并 行 化 的 读 写 能 力 ， 使 NAS 能 够 
实现 更 高 的 数据 吞吐 率 。 

2. 卷 管理 器 

在 NAS 中 ， 卷 管理 器 主要 负责 磁盘 与 分 区 的 管理 ， 磁 盘 管 理 最 重要 的 工作 是 监测 
磁盘 的 工作 状况 ， 并 对 一 些 异 常情 况 〈 如 坏 道 等 ) 进行 处 理 ; 分 区 管理 最 主要 的 工作 是 
配置 与 管理 逻辑 卷 。 

卷 管理 器 的 引入 ， 增 强 了 数据 的 安全 性 与 可 靠 性 ， 此 外 ， 还 使 数据 在 实际 的 存储 设 
备 上 的 存储 更 加 灵活 ， 易 于 组 织 。 

3. 文件 系统 

文件 系统 对 磁盘 上 的 数据 进行 组 织 、 分 配 与 记录 ， 并 将 数据 抽象 为 文件 ， 以 供 上 层 
的 系统 或 用 户 访问 与 使 用 。 Æ NAS 中 ,作为 管理 存储 设备 上 保存 数据 的 工具 ,文件 系统 
具有 如 下 特点 。 

C1) 支持 大 量 以 及 大 体积 文件 的 存储 。 

(2) 支持 多 个 进程 或 多 名 用 户 访问 文件 并 提供 保证 访问 一 致 性 的 机 制 。 

(3) 具备 日 志文 件 系 统 的 功能 ， 从 而 能 在 系统 非 正 常 关闭 (系统 骨 演 、 停 电 等 ) 的 
情况 下 ,在 下 一 次 系统 局 动 后 迅速 恢复 存储 的 数据 ,使 NAS 具有 较 高 的 安全 性 与 可 靠 性 。 

(4) 拥有 快照 (snapshot) 功能。 能 够 恢复 被 用 户 误 修改 或 误 删除 的 文件 ， 以 及 实 
现 备份 窗口 为 零 的 文件 系统 热 备 份 。 

4. 网 络 文件 共享 

不 同 的 计算 机 在 数据 传输 方式 、 网 络 协议 上 可 能 不 同 ， 为 了 支持 不 同 的 计算 机 访问 
NAS 上 的 数据 ，NAS 需要 文 持 多 种 数据 传输 方式 与 网 络 协 议 ， 此 外 ，NAS 还 需要 实现 
不 同 协议 、 文 件 系统 之 间 数 据 的 高 效 传输 。 因 此 NAS 设备 通常 具有 较 好 的 平台 无 关 性 。 

5. Web 管理 模块 

NAS 的 Web 管理 模块 方便 了 对 NAS 设备 的 远程 管理 。Web 模块 能 够 接收 远程 的 请 
求 与 命令 ， 并 根据 接收 到 的 请 求 与 命令 ， 控 制 NAS 完成 相应 的 工作 。 通 过 Web 模块 ， 
用 户 能 够 利用 浏览 器 对 NAS 设备 进行 操作 并 监控 NAS 设备 的 工作 状态 。 因 此 ， 用 户 只 
要 拥有 适当 的 管理 权限 ， 就 可 以 在 网 络 上 的 任何 接 入 点 的 任何 操作 系统 平台 上 对 NAS 
设备 进行 操作 与 监控 ， 极 大 地 方便 了 对 NAS 设备 的 管理 。 


8.3 NAS 文件 系统 VO 与 性 能 


8.3.1 网络 文件 系统 概述 


NAS 设备 支持 对 公用 互联 网 文件 系统 (common internet file system, CIFS) 或 网 络 
文件 系统 (network file system, NFS) 进行 读 写 ， 也 文 持 同 时 对 二 者 进行 读 写 。NAS 文 
件 系 统 示意 图 如 图 8-9 所 示 。 
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图 8-9 NAS 文件 系统 示意 图 


8.3.2 CIFS 


CIFS (Common Internet File System) 是 由 微软 的 SMB (Server Message Block) 发 
展 而 来 的 一 个 公共 、 开 放 的 文件 系统 。SMB 是 微软 基于 NetBIOS 设 定 的 一 套 文件 共享 
协议 。 通 过 CIFS， 用 户 可 以 访问 远程 计算 机 上 的 数据 。 此 外 ，CIFS 提供 了 一 定 的 机 制 
来 避免 读 写 神 突 与 写 写 冲突 ， 从 而 支持 多 用 户 访问 。 

为 了 让 Windows 和 UNIX 计算 机 达成 资源 共享 ， 让 Windows 客户 不 需要 更 改 设置 ， 
就 能 像 使 用 Windows NT 服务 器 一 样 使 用 UNIX 计算 机 上 的 资源 ,最 好 的 办 法 是 在 UNIX 
中 安装 支持 SMB/CIFS 协议 的 软件 。 当 所 有 主流 的 操作 系统 都 支持 CIFS 之 后 ， 计 算 机 
之 间 的 交流 就 方便 了 。Samba 帮助 Windows 和 UNIX 用 户 实现 了 这 一 愿意 。 人 们 建立 基 
于 CIFS 的 共享 服务 器 ， 将 资源 共享 给 它 的 目标 计算 机 ， 目 标 计算 机 在 自己 的 系统 中 通 
过 简单 的 共享 映射 ， 将 CIFS 服务 器 上 的 共享 资源 挂 载 到 了 自己 的 系统 中 ， 把 它 当成 自 
己 本 地 文件 系统 资源 一 样 来 使 用 。 通 过 一 个 简单 的 映射 ， 计 算 机 客户 就 从 CIFS 服务 器 
上 得 到 了 和 它 想 要 的 一 切 共 享 资源 。 


8.3.3 NFS 


NFS (Network File System) 是 由 Sun 公司 开发 的 NFS 使 用 户 能 够 共享 文件 ， 它 的 
设计 是 为 了 在 不 同 的 系统 之 间 使 用 ， 所 以 其 通信 协议 设计 与 主机 及 作业 系统 无 关 。 当 用 
户 想 用 远程 文件 时 ， 只 需要 使 用 挂 载 命 令 ， 就 可 把 远程 的 文件 系统 挂 载 在 目 己 的 文件 系 
统 之 下 ， 使 用 远程 文件 和 使 用 本 机 的 文件 没有 什么 区 别 。 

NFS 的 平台 无 关 的 文件 共享 机 制 是 基于 XDR/RPC 协议 实现 的 。 

外 部 数据 表示 〈eXternal data representation, KDR) 可 以 转换 数据 格式 。 通 常 ，XDR 
将 数据 转换 到 一 种 统一 的 标准 数据 格式 ， 从 而 保证 在 不 同 的 平台 、 操 作 系 统 与 程序 设计 
语言 中 ， 数 据 表 示 的 一 致 性 。 
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远程 过 程 调用 (remote procedure call, RPC) 请 求 远程 计算 机 给 予 服 务 。 用 户 通过 
网 络 将 请 求 传送 到 远程 计算 机 ， 由 远程 计算 机 完成 请 求 的 处 理 。 

NFS 利用 虚拟 文件 系统 (virtual file system, VFS) 机 制 ， 将 用 户 对 远程 数据 的 访问 
请 求 ， 通 过 统一 的 文件 访问 协议 和 远程 过 程 调用 ， 发 送 给 服务 器 处 理 。NFS 不 断 发 展 ， 
从 1985 年 出 现 至 今 , 已 经 经 历 了 4 个 版 本 的 更 新 ,被 移植 到 了 几乎 所 有 主流 的 操作 系统 
中 ， 成 为 分 布 式 文件 系统 事实 上 的 标准 。NFS 出 现在 一 个 网 络 状态 不 太 稳定 的 时 代 ， 起 
初 是 基于 UDP 传输 的 ， 而 并 未 采用 可 靠 性 较 高 的 TCP。 虽 然 UDP 在 可 靠 性 较 好 的 局 域 
网 中 工作 良好 ， 但 在 可 靠 性 较 差 的 广域网 如 互联 网 上 运行 时 ， 则 不 能 胜任 。 当 前 ， 随 着 
TCP 的 改进 ， 运 行 于 TCP 上 的 NFS 可 靠 性 高 、 性 能 良好 。 


8.3.4 CIFS 与 NFS 的 比较 
CIFS 与 NFS 的 比较 如 表 8-1 所 示 。 


表 8-1 CIFS 5 NFS 的 比较 
O RA | ” 基于 网 络 ， 可 靠 性 要 求 高 | 独立 于 传输 
易 用 性 无 需 额外 软件 需要 安装 专用 软件 
安全 性 无 法 进行 错误 恢复 可 以 进行 错误 恢复 
文件 转换 不 保留 文件 格式 特性 保留 文件 格式 特性 
8.4 NAS 技术 


8.4.1 NAS 技术 的 实现 


1. 传统 NAS 

传统 的 NAS 文件 服务 器 是 功能 单一 的 简化 型 服务 器 ， 在 架构 上 较为 简单 ， 键 盘 、 
上 鼠标、 显示器、 声卡、 扩展 持 槽 、 各 式 连 接口 等 都 不 需要 ， 其 在 外 观 上 就 像 一 个 机 箱 ， 
只 需 电源 与 简单 的 控制 钮 。 

传统 的 NAS 服务 器 使 用 以 太 网 和 TCP/IP 协议 ， 当 进行 文件 共享 时 ， 利 用 NFS 或 
CIFS 分 别 与 UNIX/Linux 或 Windows 系统 通信 。 传统 NAS 系统 的 优势 也 是 显而易见 的 。 

。 部 署 非常 简单 ， 只 需 与 传统 交换 机 相连 即 可 。 

。 成 本 较 低 ， 投 资 仅 限 于 一 台 NAS 服务 器 ， 而 不 像 SAN 是 整个 存储 网 络 。 

e NAS 服务 器 的 管理 非常 简单 ， 支 持 Web 界面 的 客户 端 管理 ， 对 熟悉 操作 系统 的 

网 络 管理 员 来 说 ， 管 理 设 备 非 常 容易 。 

2. NAS 引擎 

传统 的 NAS 存储 设备 在 文件 存储 工作 中 遇 上 了 新 的 性 能 及 扩展 性 问题 ， 毕 竟 传 统 
的 相对 成 熟 的 NAS 存储 系统 ,是 在 存储 资源 比较 昂贵 、 数 据 产 生 速 度 较 慢 的 环境 下 产生 
的 ,在 如 今 信息 爆炸 的 环境 下 ,新 的 NAS 解决 方案 可 以 借助 集群 技术 来 提高 存储 的 容量 、 
性 能 、 可 用 性 和 可 靠 性 。 
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SAN+NAS 引擎 的 组 合 方案 ， 主 要 用 于 将 多 个 文件 服务 器 整合 到 一 个 集中 管理 的 存 
储 环境 内 。 通 过 NAS AR CI NAS 引擎 ) 来 调节 当前 SAN 系统 的 负载 平衡 和 资源 分 配 ， 
是 一 个 优秀 的 解决 方案 。 目 前 大 多 数 主流 品牌 的 存储 供应 商 均 推出 各 自 的 NAS 网 关 产 
品 ， 这 也 促进 了 “SAN+NAS 引擎 ”组 合 方案 的 广泛 普及 。NAS 网 关 拥 有 高 度 的 灵活 性 
和 可 扩展 性 ， 能 够 更 好 地 利用 存储 资源 ， 而 且 可 以 同时 管理 NAS 和 SAN。 除 了 这 些 
优点 之 外 ， 由 于 不 同类 型 的 SAN 存储 阵列 应 用 日 渐 增 多 ，NAS 网 关 也 越 来 越 受用 户 
的 青睐 。 

3. WSS 

WSS (Windows Storage Server) 是 基于 Windows Server 开发 的 专用 网 络 附加 存储 服 
Sas (NAS) 系统 专用 软件 ， 则 在 实现 网 络 存储 的 可 靠 性 、 无 颖 集成 以 及 最 佳 价 值 。 WSS 
可 与 现 有 的 基础 设施 集成 ， 并 且 文 持 跨 平台 的 文件 共享 服务 以 及 所 存储 数据 的 备份 和 复 
制 。 若 要 将 多 个 文件 服务 器 合并 为 可 降低 成 本 并 且 可 基于 策略 来 管理 存储 资源 的 单一 解 
决 方案 ，WSS 将 是 理想 的 解决 方案 。 

WSS 包括 高 级 的 可 用 性 功能 , 如 基于 时 间 点 的 数据 副本 、 复制 以 及 服务 器 群集 功能 。 
WSS 解决 方案 是 预先 配置 好 的 ， 在 儿 分 钟 内 就 可 以 完成 默认 部 署 ， 其 基于 Web 的 用 户 
界面 也 使 得 管理 变 得 非常 容易 。 借 助 WSS 与 现 有 基础 设施 集成 ， 企 业 完 全 可 以 使 用 常 
见 的 网 络 环境 、 标 准 的 管理 软件 以 及 Active Directory 服务 。 原 始 设 备 制 造 商 (OEM) 提 
供 了 预 配置 的 WSS 解决 方案 ， 其 大 小 从 几 百 GB 到 数 TB 不 等 。 


8.4.2 NAS 技术 的 特点 


由 NAS 的 结构 可 知 ，NAS 设备 具有 以 下 特点 。 

L. 安装 简单 、 管 理 方便 

NAS 设备 在 网 络 中 的 位 置 没 有 限制 , 系统 管理 人 员 可 以 依据 网 络 系统 对 数据 存储 的 
需求 和 网 络 中 的 数据 流量 来 设置 NAS 设备 ， 不 需要 构建 专用 的 网 络 ， 并 且 由 于 NAS 设 
备 上 有 了 网卡、 操作 系统 和 标准 的 网 络 协议 ， 因 而 可 以 很 方便 地 将 其 连接 到 网 络 环境 中 ， 
只 需 很 少 的 配置 就 可 以 投入 运行 。 

2. 具有 文件 接口 、 兼 容 性 好 

最 重要 的 一 类 NAS 设备 是 文件 器 (filer)， 这 是 一 种 专门 提供 文件 服务 和 文件 存储 
的 NAS 设备 。 因 而 NAS 设备 对 外 界 的 接口 通常 是 文件 ， 也 就 是 说 ， 用 户 看 见 的 NAS 
设备 是 文件 服务 器 ， 而 不 是 块 数据 设备 ， 是 文件 的 集合 ， 而 不 是 数据 块 的 数组 。 由 于 使 
用 标准 协议 ， 所 以 可 以 方便 地 将 不 同 厂 商 的 NAS 产品 集成 在 一 起 。 

3. 共享 简易 、 可 靠 性 高 

NAS 设备 采用 标准 的 网 络 协议 和 标准 的 网 络 文件 系统 ,因而 能 够 轻易 地 支持 多 个 系 
统 之 间 的 数据 共享 。NAS 设备 中 不 再 拥有 宛 余 的 成 分 和 模块 , NAS 设备 的 软 硬 件 都 经 过 
了 优化 设计 ， 具 有 较 高 的 性 能 。 

4. 性 能 优越 、 管 理 成 本 低 

NAS 设备 的 软 、 硬 件 都 经 过 了 优化 设计 ， 并 去 除了 见 余 的 成 分 和 模块 ， 因 而 NAS 
的 设备 具有 较 高 的 性 能 。 由 于 NAS 设备 很 容易 构建 和 管理 , 并 可 以 文 持 多 种 操作 系统 和 
文件 系统 ， 所 以 由 NAS 设备 组 成 的 网 络 存 储 系统 的 管理 成 本 较 低 。 
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5. 降低 通用 服务 器 负荷 、 扩 展 性 好 

NAS 设备 的 使 用 ， 使 网 络 上 的 其 他 服务 器 可 以 不 再 管理 外 部 存储 设备 ， 可 以 将 更 多 
的 资源 用 于 处 理 其 他 重要 工作 。 当 系统 的 存储 资源 紧张 时 , 可 以 增加 NAS 设备 的 磁盘 数 
量 ， 也 可 以 新 增 一 台 NAS 设备 ， 两 种 方法 都 比较 容易 。 


8.5 NAS 解决 方案 


8.5.1 NAS 的 应 用 


l. NAS 的 传统 应 用 一 一 海量 存储 

NAS 首要 的 用 途 就 是 解决 人 们 对 共享 数据 的 存储 需求 。 共享 数据 从 以 前 的 以 服务 器 
为 中 心 的 存储 方式 转变 到 以 网 络 为 中 心 的 网 络 核 心 存储 架构 ,在 办 公 环 境 中 增加 一 个 NAS 
存储 设备 ， 整 个 办 公 网 络 上 的 所 有 用 户 、 工 作 站 和 服务 器 集群 就 能 使 用 数 TB 甚至 更 大 的 
存储 空间 ， 而 且 这 种 集中 式 的 数据 共享 为 数据 的 增长 、 备 份 都 提供 了 更 为 方便 的 途径 。 

2. NAS 的 现代 应 用 一 一 应 用 平台 存储 

Web、FTP、 邮 件 服务 是 互联 网 中 最 为 重要 的 应 用 ， 近 年 来 实现 了 飞速 增长 ， 视 频 
点 播 、 资 料 查询 等 应 用 平台 也 在 互联 网 中 莲 勃 发 展 ， 这 些 应 用 平台 的 数据 存储 单纯 依靠 
服务 器 的 存储 容量 是 远 远 不 够 的 ， 而 且 随 着 人 们 对 数据 、 信 息 的 依赖 ， 要 求 数 据 保 护 有 
更 高 的 可 靠 性 和 更 少 的 备份 窗口 。NAS 成 为 这 些 应 用 平台 的 首选 。NAS 的 大 容量 网 络 存 
储 空间 可 满足 存储 需求 。NAS 存储 设备 有 着 简单 的 管理 模式 , 而 且 存 储 系统 支持 多 用 户 、 
多 平台 的 数据 共享 ， 能 集中 管理 数据 并 拥有 完善 的 数据 保护 措施 。 

3. NAS 的 结构 化 应 用 一 一 NAS 与 数据 库 系 统 的 联合 

NAS 存储 系统 一 直 应 用 于 非 结 构 化 的 二 进 制 文件 ， 而 随 着 NAS 的 发 展 ， 一 些 NAS 
厂商 开始 和 数据 库 厂 商 合 作 ， 将 NAS 存储 应 用 到 数据 库 的 结构 化 数据 。 

作为 一 种 存储 共享 设备 ，NAS 以 往 通 常 只 在 企业 环境 中 才 会 出 现 , 然而 随 大 个 人 存 
储 需 要 的 增长 ， 尤 其 是 像 HDTV、 高 像素 相片 这 类 文件 的 流行 ， 文 件 越 来 越 大 ， 存 储 、 
备份 这 些 庞大 的 资料 都 比较 麻烦 ， 这 促成 NAS ea 

5. NAS 的 高 级 应 用 一 一 NAS 远程 备份 容 

NAS 作为 一 个 网 络 存 储 设备 ， 直入 电网 入 二 支持 TCP/IP， 因 此 主流 的 基于 IP 
的 备份 、 容 灾 方 式 都 能 在 NAS 上 快速 实现 。 一 些 NAS 存储 设备 厂商 与 数据 保护 软件 合 
作 ， 将 NAS 设备 直接 集成 为 备份 软件 的 客户 端 ， 轻 易 地 实现 数据 的 备份 、 容 灾 。 

6. NAS 的 集群 应 用 一 一 集群 机 头 + 后 端 存储 

为 解 传统 NAS 系统 之 忧 ， 华 为 公司 借助 集群 技术 来 提高 存储 系统 的 容量 、 性 能 、 
可 用 性 、 可 靠 性 ， 目 主 研发 集群 NAS 产品 OceanStor N8500. 

与 传统 NAS 相 比 ， 集 群 NAS 有 以 下 三 个 方面 的 优点 。 

(1) 存储 空间 的 海量 性 与 可 扩展 性 。 当 企业 数据 的 存储 容量 不 足 时 ， 存 储 系统 要 能 
够 实现 在 线 容量 的 扩展 而 不 中 断 前 端 主机 业务 的 访问 ,N8500 集群 NAS 系统 可 在 线 将 存 
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储 单元 数据 扩充 至 64 台 ， 最 大 容量 达到 十 数 PB (1PB=1 024TB=1 048 576GB)。 后 端 存 
储 单元 支持 传统 机 械 硬 盘 和 SSD 固态 硬盘 ，FC、SAS 及 SATA 等 磁盘 接口 ， 以 及 后 端 
存储 单元 不 同 磁盘 类 型 的 混 插 , 借助 自 带 的 动态 分 级 存储 (dynamic storage tiering, DST) 
功能 来 满足 数据 在 不 同 生 命 周 期 阶段 的 不 同 服务 质量 。 

(2) 多 用 户 访问 的 并 发 性 和 全 共享 性 。N8500 集群 NAS 的 引擎 节点 ， 要 为 大 量 的 用 
户 提供 并 发 服务 ， 必 须 保 证 N8500 NAS 引擎 的 计算 能 力 和 VO 带宽 足够 ，N8500 集群 
NAS 系统 支持 2 一 24 个 NAS 引擎 ,其 性 能 可 随 集群 NAS 引擎 节点 数量 增加 呈 线 性 增长 ， 
可 以 在 线 平 滑 、 快 速 地 扩展 集群 节点 来 提高 N8500 系统 的 性 能 ， 也 支持 单个 NAS 引擎 
的 硬件 升级 扩展 (CPU、 内 存 )。 从 不 同 层面 提升 整个 集群 NAS 引擎 的 整体 处 理 能 力 。 
O O 集群 设备 的 易 用 性 和 可 用 性 。N8500 集群 NAS 存储 系统 易于 管理 和 使 用 ,支持 

新 增 引擎 节点 目 动 部 署 ， 并 有 目 动 实现 负载 分 担 ， 无 需 人 工 干 预 。 灵 活 的 故障 告警 监控 机 

制 ， 提 供 邮 件 、SNMP 和 Syslog 日 志 查 询 等 告警 和 监控 方式 ， 提 高 维护 效率 。 引 擎 节点 
间 采 用 Active 一 Active 工作 模式 ， 保 障 在 一 个 甚至 多 个 节点 出 现 故 障 时 ， 不 影响 主机 业 
务 运行 ， 从 存储 单元 到 链 路 再 到 NAS 引擎， 所 有 硬件 设备 全 元 余 设 计 ， 保 障 集群 NAS 
设备 的 持续 运行 。 

可 见 ，OceanStor N8500 在 NAS 引擎、 存储 单 元 等 层面 组 成 的 集群 ， 其 性 能 和 容量 
等 属性 可 通过 集群 的 方式 得 以 到 加 和 扩展 ， 不 但 有 效 解 决 了 高 性 能 的 文件 共享 问题 ， 还 
兼顾 了 数据 的 高 可 用 性 及 文件 系统 的 高 扩展 性 。 


8.5.2 NAS 的 典型 应 用 场景 


I. 办 公 OA 解决 方案 

(1) 用户 面临 的 挑战 

办 公 OA 应 用 与 服务 的 种 类 也 较 多 ， 对 于 系统 经 营 和 管理 能 力 要 求 较 高 ， 而 业务 运 
营 经 常 需要 信息 /文档 共享 。 因 此 OA PARRA SAM OO 8-10 所 示 。 


一 -一 -一 -一 -一 一 -一 -一 一 -一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 -一 一 一 一 一 一 
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图 8-10 OA 办 公 解 决 方案 组 网 


(2) 该 解决 方案 的 优势 
方便 的 数据 集中 存储 与 共享 ， 实 现 了 存储 资源 的 整合 。 
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安装 调试 简单 ， 容 易 管 理 ， 对 管理 人 员 也 没有 特殊 的 要 求 。 

开放 的 存储 系统 支持 异 构 平 台 ， 支 持 多 种 文件 系统 共享 一 份 数据 。 

自 带 有 功能 强大 的 数据 保护 功能 。 

优异 的 性 价 比 : 实施 与 维护 成 本 低 于 普通 文件 服务 器 。 

2. 医疗 行业 PACS 解决 方案 

(1) 用户 面临 的 挑战 

PACS 医疗 影像 系统 每 天 都 产生 大 量 的 影像 数据 ， 这 些 数据 要 求 确 保 内 容 不 被 修改 ， 
并 且 要 随时 可 供 调用 ， 还 需要 长 期 保存 。 医 疗 行业 PACS 解决 方案 组 网 如 图 8-11 所 示 。 


LAN 





NAS 服务 器 


图 8-11 医疗 行业 PACS 解决 方案 组 网 


(2) 该 解决 方案 的 优势 

该 方案 提供 了 一 种 容量 大 、 安 全 性 高 、 管 理 方便 、 数 据 碍 询 快捷 的 物理 介质 来 安全 、 
有 效 地 存储 和 管理 这 些 数据 。 

使 用 NAS 解决 方案 可 以 将 医院 放射 科 内 的 数字 化 图 片 安 人 全、 方便 、 有 效 地 存储 和 
管理 起 来 ， 从 而 缩短 了 数据 存储 、 碍 找 的 时 间 ， 提 高 了 工作 效率 。 

3. 校园 网 解决 方案 

C1) 用 户 面 临 的 挑战 

现在 学 校 需要 大 量 的 资源 信息 ， 以 满足 学 生 与 教师 的 需求 。 随 着 校园 内 数据 资源 的 
不 断 增加 ， 需 要 存储 数据 的 物理 介质 具有 大 容量 的 存储 空间 和 安全 性 ， 并 要 有 非常 快 的 
传输 速率 ， 确 保 整 个 数据 资料 安全 、 快 速 存 取 。 校 园 网 解决 方案 组 网 如 图 8-12 所 示 。 

(2) 该 解决 方案 优势 

NAS 提供 了 一 个 高 效 、 低 成 本 的 资源 应 用 系统 。NAS 本 身 就 是 一 套 独立 的 网 络 服 
务 器 ， 可 以 灵活 布置 在 校园 网 络 的 任意 网 段 上 ， 提 高 了 资源 信息 服务 的 效率 和 安全 性 ， 
同时 具有 良好 的 可 扩展 性 ， 且 成 本 低廉 。 

提供 灵活 的 个 人 磁盘 空间 服务 。NAS 可 以 为 每 个 用 户 创建 个 人 的 磁盘 使 用 空间 , 方 
便 师 生 查找 和 修改 自己 创建 的 数据 资料 。 

提供 数据 在 线 备份 的 环境 。NAS 支持 外 接 的 磁带 机 ， 它 能 有 效 地 将 数据 从 服务 器 中 
传送 到 外 接 的 磁带 机 上 ， 保 证 数据 安全 、 快 捷 备份 。 
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= > Aiie 


以 太 网 交换 机 NAS 设备 


校园 网 服务 器 
















LAN 





多 媒体 教室 办 公 室 网 络 教室 网 络 
图 8-12 校园 网 解决 方案 组 网 


有 效 保护 资源 数据 。 NAS 具有 上 自动 日 志 功 能 ， 可 自动 记录 所 有 用 户 的 访问 信息 。 幅 
入 式 的 操作 管理 系统 能 够 保证 系统 永 不 崩溃 ， 以 保证 连续 的 资源 服务 ， 并 有 效 保护 资源 
数据 的 安全 。 


8.6 NAS 与 SAN 的 比较 


NAS 是 一 种 文件 共享 服务 ，NAS 设备 拥有 自己 的 文件 系统 ， 并 能 通过 NFS 或 CIFS 
对 外 提供 文件 访问 服务 。 

下 面 将 在 可 扩展 性 、 服 务 方式 以 及 性 能 方面 比较 NAS 与 SAN。 

1. 可 扩展 性 

NAS 与 SAN 都 是 网 络 存 储 系统 ， 都 负责 管理 存储 资源 ， 都 通过 网 络 向 用 户 提 供 存 
储 服 务 ， 都 具有 较 好 的 扩展 性 。 

2. 服务 方式 

NAS 和 SAN 的 本 质 区 别 在 于 ， 对 用 户 而 言 ，SAN 提供 的 是 块 级 数据 的 传输 、 存 储 
ARS, i NAS 提供 的 是 文件 级 的 传输 、 存 储 服务 ; SAN 的 文件 系统 建立 在 主机 方 , NAS 
的 文件 系统 则 建立 在 NAS 设备 上 。NAS 与 SAN 的 差异 如 图 8-13 所 示 。 





图 8-13 NAS 与 SAN 的 差异 


3. 性 能 
NAS 设备 与 网 络 服 务 器 、 用 户 客户 机 等 共享 供 业 务 使 用 的 局 域 网 络 (LAN), LAN 
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的 性 能 容易 成 为 系统 瓶颈 ， 当 有 大 量 存储 操作 时 ， 会 降低 其 他 系统 的 运行 速度 。SAN 采 
用 专用 的 存储 网 络 ， 不 占用 LAN 的 带宽 ， 不 会 因为 过 多 的 存储 操作 而 降低 其 他 网 络 应 
用 的 性 能 。 


8.7 ”华为 NAS 产品 实现 与 应 用 


8.7.1 OceanStor N8500 集群 NAS 


N8500 是 一 球 集 群 化 的 中 高 端 NAS 存储 系统 , 针对 高 效 数 据 共享 产品 的 需求 ， 具有 
灵活 的 横 回 及 纵向 可 扩展 性 ; 可 用 于 金融 、 政 府 、 石 油 天 然 气 、 健 康 和 生命 科学 、 制 造 
业 、E-Discovery 等 行业 。 

N8500 在 NAS&SAN (Storage Area Network & Network Attached Storage) 一 体 化 网 
络 中 所 处 的 位 置 和 应 用 如 图 8-14 所 示 。 





域 控制 器 备份 服务 器 


通过 千 兆 /万 兆 以 太 网 连接 FC SANHIP SAN 应 用 ”通过 以 太 网 连接 备份 管理 
文件 读 写 访问 通过 块 设备 读 写 LDAP/AD NIS 域 管理 


NFS/CIFS/FTP/HTTP 等 协议 













$ 





通过 千 兆 /万 兆 以 太 网 连接 本 地 用 户 
通过 NFS/CIFS/FTP/HTTP 等 协议 
进行 文件 读 写 访问 





通过 千 兆 /万 兆 以 太 网 连接 
iit NFS/CIFS/FTP/HTTP 等 协议 
进行 文件 读 写 访问 〈 域 环境 ) 域 用 户 


异地 容 灾 应 
本 地 备份 /异地 备 册 ype 


SAN 远程 镜像 





备份 介质 


远程 N8500 


8-14 N8500 在 NAS&SAN 一 体 化 网 络 中 所 处 的 位 置 和 应 用 
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N8500 业务 应 用 可 禾 盖 于 以 下 领域 。 

© 互联 网 及 大 型 局 域 网 视频 、 音 频 共 享 和 下 载 。 

© 政府 行业 视频 监控 和 卫星 图 像 。 

© 金融 行业 风险 分 析 、 证 券 公司 、 金 融 衍 生 贸 易 和 文件 映像 。 
e 媒体 和 娱乐 行业 视频 摄取 、 编 辑 、 制 作 加 工 和 播放 。 


8.7.2 ”统一 存储 


统一 存储 实质 上 是 一 个 可 以 支持 基于 文件 的 网 络 附加 存储 (NAS)， 以 及 基于 数据 
BRAY SAN 的 网 络 化 的 存储 架构 。 由 于 其 支持 不 同 的 存储 协议 为 主机 系统 提供 数据 存储 ， 
因此 也 称 为 多 协议 存储 。 统 一 存储 是 一 项 支持 对 以 不 同方 式 组 织 的 数据 采用 对 应 的 方 
式 进行 访问 的 技术 。 通 常 ， 统 一 存储 支持 同时 访问 以 块 、 文 件 和 对 和 象 等 形式 组 织 起 来 
的 数据 。 

统一 存储 要 求实 行 统一 管理 ， 即 一 个 存储 系统 要 同时 管理 块 数据 和 文件 数据 ， 如 果 
没有 统一 管理 ， 实 现 整 合 和 简化 的 目标 就 会 受到 影响 。 一 些 厂商 通过 光纤 通道 和 iSCSI 
来 提供 块 存储 ， 男 一 些 厂商 则 坚持 只 用 iSCSI， 因 为 它 更 容易 实现 。 

1. 统一 存储 的 系统 基础 

在 统一 存储 系统 中 ， 访 问 不 同 的 数据 单元 〈 块 、 文 件 、 对 象 ) 是 通过 不 同 的 协议 与 
特定 的 硬件 来 实现 的 。 

存储 控制 器 与 应 用 服务 器 可 以 通过 特定 的 协议 连接 ， 实 现 块 级 数据 的 访问 。 此 外 ， 
存储 控制 器 还 负责 整个 物理 存储 系统 ， 不 仅 癌 应 用 服务 器 提供 IO 服务 ， 也 可 以 向 NAS 
机 头 和 OSD 节点 提供 服务 。 

NAS 机 头 是 一 个 向 NAS 用 户 提供 文件 访问 服务 的 文件 服务 器 。NAS 机 头 通过 块 级 
数据 访问 协议 与 存储 控制 器 连接 ， 从 而 能 够 从 物理 存储 设备 上 访问 数据 并 将 数据 以 文件 
的 形式 提供 给 NAS 用 户 使 用 。 

类 似 于 NAS 机 头 ，OSD 节点 也 通过 块 级 数据 访问 协议 与 存储 控制 器 连接 。OSD 节 
点 以 块 级 数据 的 形式 从 物理 存储 设备 上 获取 数据 ， 并 将 数据 以 对 象 的 形式 提供 给 用 户 
使 用 。 

2. 统一 存储 中 的 数据 访问 

在 统一 存储 系统 中 ， 不 同方 式 组 织 起 来 的 数据 有 着 不 同 的 访问 方式 。 但 无 论 数据 以 
何 种 形式 存储 ， 访 问 请 求 最 终 都 会 转换 为 一 系列 的 块 级 访问 请 求 。 

对 于 块 级 数据 的 访问 ， 应 用 服务 器 可 以 直接 利用 特定 的 协议 向 存储 控制 器 访问 。 目 
前 常见 的 支持 块 级 数据 访问 的 协议 主要 有 iSCSI, FC 和 FCoE， 通常 存储 控制 器 具有 这 
些 常 见 协 议 的 访问 接口 ， 可 以 直接 访问 。 | 

对 于 文件 级 数据 的 访问 ， 应 用 服务 器 会 发 出 文件 访问 请 求 ， 这 样 的 请 求 会 被 NAS 
机 头 接受 ， 并 将 其 转换 为 若干 块 级 IO RK, BH NAS 机 头 将 得 到 的 块 级 IO 请 求 交 给 
存储 控制 器 处 理 。 

对 象 级 数据 的 访问 过 程 类 似 于 文件 级 数据 的 访问 过 程 。 应 用 服务 器 发 出 访问 对 象 数 
据 的 请 求 ， 请 求 被 OSD 节点 接受 ， 并 将 其 转换 为 若干 块 级 IO 请 求 ， 再 由 OSD 节点 将 
得 到 的 块 级 IO 请 求 交 给 存储 控制 器 处 理 。 
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8.8 本 章 总 结 


完成 本 章 学 习 ， 将 能 够 : 

。 了 解 什 么 是 NAS。 

。 了 解 的 发 展 历史 。 

。 熟悉 NAS 的 演化 过 程 。 

。 熟悉 NAS 中 CIFS 的 工作 原理 。 

e 熟悉 NAS 中 NFS 的 工作 原理 。 

。 掌握 NAS 的 应 用 。 

本 章 从 NAS 的 产生 与 发 展 、NAS 系统 组 成 与 部 件 、NAS 文件 系统 与 IO HERE. NAS 
技术 、NAS 解决 方案 等 方面 对 NAS 进行 讲解 。 此 外 ， 结 合 前 一 章 关 于 SAN KAR, X 
NAS 和 SAN 进行 比较 与 总 结 ， 并 在 最 后 介绍 了 华为 的 相关 产品 。 


8.9 练习 题 


一 、 选 择 题 
1. 以 下 哪些 不 是 NAS 的 优点 ? C ) 
A. 扩展 性 比 SAN 好 B. 使 用 简便 
C. 针对 文件 共享 进行 优化 D. 针对 块 数 据 传输 进行 优化 
答案 (D) 
2. NAS 通常 支持 的 网 络 文件 共享 协议 包括 和 
A. FAT32 B. NTFS C.: NFS D. CIFS 
答案 (CD) 
3. NAS 的 体系 结构 中 包括 ( pA 
A. 操作 系统 B. 文件 系统 C. 网 络 接口 D. 存储 子 系统 
答案 (CD) 
4. NAS 使 用 ( ) 作为 其 网 络 传输 协议 。 
A. FC B. SCSI C. TCP/IP D. IPX 
ER (C) 
5. NAS 对 于 ( ) 类 型 的 数据 传输 性 能 最 好 。 
A. 大 块 数据 B. 文件 C. 小 块 消息 D. 连续 数据 块 
答案 (B) 
6. 通常 而 言 ， NAS 传输 文件 时 ， 对 业务 网 络 的 性 能 没有 影响 。( ) 
A. Ture B. False 
答案 (B) 


7. NAS 的 软件 组 件 包括 ( js 
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A. 网 络 文件 共享 B. 文件 系统 C. 操作 系统 D. 存储 管理 
答案 (ABC) 
8. 相 较 于 DAS 而 言 ， 以 下 不 是 NAS 特点 的 选项 是 ( 
A. NAS 是 从 网 络 服 务 器 中 分 离 出 来 的 专用 存储 服务 器 
B. 与 DAS 相 较 而 言 ， 在 NAS 系统 中 ， 应 用 层 的 程序 及 其 运行 的 进程 是 与 数据 
存储 单元 分 离 的 
C. NAS 系统 与 DAS 系统 相同 ， 都 没有 自己 的 文件 系统 
D. NAS 的 设计 便于 系统 同时 满足 多 种 文件 系统 的 文件 服务 需求 
答案 (C) 
9. NAS 系统 功能 强大 、 易 于 扩展 ，NAS 完全 可 以 替代 DAS 架构 。( ) 
A. True B. False 
答案 (B) 


二 、 简 答题 

1. 现在 NAS 的 功能 日 益 丰 富 ， 甚 至 具备 了 多 媒体 功能 ， 你 认为 NAS 会 取代 个 人 
计算 机 吗 ? 

2. 简 述 NAS 与 SAN 的 区 别 。 

3. 除了 8.5 节 中 提 到 的 NAS 应用， 你 认为 NAS 还 能 用 于 何 种 环境 ? 
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对 象 存储 的 产生 和 发 展 
对 象 存储 模型 

对 象 存储 的 实现 

对 象 存 储 的 优点 

本 章 总 结 

练习 题 








关于 本 章 


对 象 和 存储 是 一 种 基于 对 象 的 存储 技术 。 与 传统 意义 上 的 提供 面 癌 块 (block-oriented ) 
接口 的 磁盘 和 存储 系统 不 同 ， 对 象 存储 系统 将 数据 封装 到 大 小 可 变 的 “ 容 船 ”中 ， 称 为 对 象 
(object) ， 通 过 对 对 象 进 行 操作 使 系统 工作 在 一 个 更 高 的 层级 中 。 

对 象 存 储 综合 了 NAS 和 SAN 的 优点 ， 同 时 具有 SAN 的 高 速 访问 和 NAS 的 数据 共享 等 优 
势 。 本 章 主 要 介绍 对 象 存 储 技术 ， 包 括 对 象 存 储 技 术 的 概念 、 发 展 、 基 本 原理 与 实现 ， 
并 与 SAN 、NAS 技 术 进 行 了 对 比 ， 还 介绍 了 华为 公司 OceanStor UDS ( Universal Distributed 
Storage ) 海量 存储 系统 的 应 用 。 
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9.1 对象 存储 的 产生 和 发 展 


9.1.1 “对象 存储 (OBS ) 概述 


随 着 计算 机 技术 及 其 相关 网 络 应 用 的 飞速 发 展 ， 网 络 传输 信息 量 的 不 断 膨胀 ， 人 们 
对 网 络 存储 的 需求 也 日 益 增 多 。 存 储 系统 不 再 是 计算 机 系统 的 附属 设备 ， 而 成 为 互联 网 


: 中 与 计算 和 传输 同等 重要 的 三 大 基石 之 一 ， 网 络 存储 已 成 长 为 信息 化 的 核心 发 展 领域 ， 


并 逐渐 承担 看 信息 化 核心 的 重任 。 事 实 上 ,信息 技术 在 任何 时 候 都 是 计算 、 传 输 和 存储 
技术 三 位 一 体 的 完美 结合 ， 三 者 缺 一 不 可 。 

Biz SAN 和 NAS 两 种 体系 结构 逐渐 成 熟 ， 研 究 人 员 开 始 考 虑 如 何 将 两 种 体系 结构 
结合 起 来 ， 以 充分 利用 两 者 的 优势 。 另 一 方面 ， 随 着 信息 时 代 的 不 断 发 展 ， 各 种 应 用 对 
存储 系统 提出 了 更 多 的 需求 : 

(1) 大 容量 : 现在 的 数据 量 比 以 前 任何 时 期 都 多 ， 生 成 的 速度 更 快 。 

(2) 高 性 能 : 数据 访问 需要 更 高 的 带宽 。 

(3) 高 可 用 性 : 不 仅 要 保证 数据 的 高 可 用 性 ， 还 要 保证 服务 的 高 可 用 性 。 

(4) 可 扩展 性 : 应 用 在 不 断 变化 ， 系 统 规模 也 在 不 断 变化 ， 这 就 要 求 系 统 具有 很 好 
的 扩展 性 ， 并 在 容量 、 性 能 、 管 理 等 方面 都 能 适应 应 用 的 变化 。 

(5) 可 管理 性 : 随 厦 数据 量 的 飞速 增长 ， 存 储 的 规模 越 来 越 庞 大 ， 存 储 系 统 本 身 也 
越 来 越 复杂 ， 这 给 系统 的 管理 、 运 行 带 来 了 很 高 的 维护 成 本 。 

(6) 按 需 服务 : 能 够 按照 应 用 需求 的 不 同 提 供 不 同 的 服务 ， 如 不 同 的 应 用 、 不 同 的 
客户 端 环境 、 不 同 的 性 能 

基于 多 种 分 布 式 文件 系统 的 研究 成 果 ， 人 们 对 体系 结构 的 认识 不 断 深入 ， 对 象 存 储 
系统 (object storage system/object-based storage system) 应 运 而 生 。 其 综合 了 NAS 和 SAN 
的 优点 ， 同 时 具有 SAN 的 高 速 访问 和 NAS 的 数据 共享 等 优势 。 与 传统 意义 上 的 提供 面 
问 块 〈block-oriented) 接口 的 磁盘 存储 系统 不 同 ， 对 象 存 储 系统 将 数据 封装 到 大 小 可 变 
的 “容器 ”中 ， 称 为 对 象 (Object) ， 通 过 对 对 象 进 行 操 作 使 系统 工作 在 一 个 更 高 的 层 
级 中 如 图 9-1 所 示 。 


基于 块 设备 的 磁盘 驱动 器 基于 对 象 的 磁盘 驱动 器 





图 9-1 传统 块 存储 与 对 象 存储 结构 对 比 示意 图 
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9.1.2 ”对 象 存储 的 发 展 趋 势 


对 象 存储 技术 起 源 于 卡耐基 梅 隆 大 学 (Carnegie Mellon University, CMU) 并 行 数 
据 实 验 室 (Parallel Data Lab, PDL) 于 1995 年 开始 的 NASD (Network-Attached Security 
Disks) 项 目 。NASD 的 基本 思想 是 将 处 理 器 集成 到 磁盘 驱动 器 ， 使 它 具 有 一 定 的 智能 ， 
能 够 独立 管理 自身 的 安全 、 存 储 和 网 络 通信 。 为 此 NASD 提出 四 点 创新 : 直接 向 客户 端 
传送 数据 、 通 过 加 密实 现 安全 接口 、 异 步 非 临界 通道 (客户 端 在 大 多 数 情 况 下 并 不 需要 
癌 文 件 系统 发 送 同 步 请 求 )》 以 及 大 小 可 变 的 数据 对 和 象 。 

自 NASD 项 目 之 后 ， 工 业界 迅速 开发 了 基于 对 象 的 存储 系统 ， 其 中 著名 的 有 : 

e Oracle 公司 的 Lustre。 

。 Panasas 公司 的 ActiveScale。 

。 IBM 公司 的 Storage Tank。 

e Intel 公司 的 运用 iSCSI 和 OSD 的 参考 原型 一 一 Intel’s Open Storage Toolkit. 

Lustre 是 高 性 能 的 集群 系统 ， 在 美国 能 源 部 (U.S. Department Of Energy, DOE) 、 
Lawrence Livermore 国家 实验 室 、Los Alamos 国家 实验 室 、Sandia 国家 实验 室 及 Pacific 
Northwest 国家 实验 室 的 高 性 能 计算 系统 中 已 得 到 了 应 用 , IBM 研制 的 Blue Gene 也 采用 
了 Lustre 文件 系统 实现 高 性 能 存储 。Panasas ActiveScale 是 卡耐基 梅 隆 大 学 NASD MH 
的 后 续 研 究 成 果 , 是 工业 界 比 较 有 影响 力 的 对 象 存 储 文件 系统 , 并 荣获 了 ComputerWorld 
2004 创新 技术 奖 。 

学 术 机 构 也 对 对 象 存 储 技 术 做 了 深入 的 研究 ， 其 中 著名 的 有 : 

e IBM Haifa 实验 室 的 Antara. 

e IBM Haifa 实验 室 的 ZFS 及 其 对 象 控制 器 原型 Object Store. 

© 卡耐基 梅 隆 大 学 基于 对 象 的 原型 系统 Ursa Minor. 

e 加 州 大 学 Santa Crmz 分 校 的 Ceph 系统 及 其 对 和 象 文件 系统 QBFS(Object-Based File 

System) 。 

在 上 述 几 个 系统 中 ，IBM Haifa 实验 室 提 出 的 Antara 是 对 象 存储 方面 最 早 的 原型 系 
统 。Haifa 实验 室 还 提出 了 专用 的 对 象 文件 系统 ， 但 仅 停 留 在 概念 阶段 ， 该 系统 是 zFS 
及 Object Store 的 基础 。Object Store Æ IBM 实现 的 基于 对 象 真正 的 原型 系统 ， 其 成 果 主 
要 用 于 zFS. Object Store 把 对 象 作为 文件 存储 在 传统 的 文件 系统 之 上 ， 以 块 设 备 作 为 存 
储 介质 , 使 用 iSCSI 作为 SCSI 命令 的 传输 层 , 并 以 此 为 基础 , 实现 了 OSD 启动 器 (OSD 
Initiator) 和 目标 器 (OSD Target) 。 

卡耐基 梅 隆 大 学 在 NASD 的 基础 上 ， 实 现 了 一 个 基于 对 象 的 原型 系统 UrsaMinor。 
该 系统 以 对 象 为 单位 选择 合适 的 数据 分 布 〈 包 括 编码 和 容错 等 )， 满 足 用 户 的 访问 模式 、 
可 靠 性 及 成 本 需求 。 加 州 大 学 Santa Cruz 分 校 的 Ceph 系统 及 其 OBFS 文件 系统 ， 可 以 
HERE Linux 虚拟 文件 系统 (VFS) 下 ， 这 使 客户 端 可 以 透明 地 访问 整个 存储 系统 ， 并 
基于 负载 热点 研究 ， 对 对 象 文件 系统 进行 了 优化 。 
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9.2 ”对象 存储 模型 


9.2.1 ”对象 存储 体系 结构 


对 象 存 储 是 一 种 新 兴 的 存储 体系 结构 。 

传统 的 基于 块 的 存储 系统 可 以 分 为 两 个 部 分 : 用 户 接口 和 存储 管理 。 用 户 接口 负责 
回 用 户 呈 现 逻 辑 数 据 结 构 ， 如 文件 、 目 录 等 ， 并 提供 访问 这 些 数据 结构 的 接口 ;存储 管 
理 负责 将 这 些 逻 辑 数据 结构 映射 到 物理 存储 设备 。 存 储 设 备 本 身 只 负责 基于 块 的 数据 传 
输 ， 元 数据 的 维护 及 数据 在 存储 设备 上 的 布局 ， 完 全 取决 于 存储 系统 。 不 同 平台 之 间 共 
享 数据 ， 需 要 已 知 对 方 的 元 数据 结构 及 数据 在 设备 上 的 分 布 。 这 种 依赖 性 使 得 共享 数据 
十 分 困难 。 

对 象 存 储 则 将 数据 封装 到 大 小 可 变 的 “对 象 ” 中 ， 并 将 存储 管理 下 放 到 存储 设备 本 
身 ， 这 使 存储 系统 可 以 对 存储 设备 中 的 “对 象 ” 进 行 平台 无 关 (platform-independent) 
的 访问 。 存 储 系统 仍 需 要 维护 自己 的 索引 信息 《〈 如 目录 的 元 数据 ) ， 以 实现 对 象 ID 与 
更 高 层次 的 数据 结构 〈 文 件 名 等 ) 的 映射 ;而 对 象 ID 与 数据 物理 地 址 的 映射 ， 以 及 元 
数据 的 维护 ， 完 全 由 存储 设备 本 身 完成 。 这 将 不 同 平台 之 间 的 数据 共享 简化 为 对 象 ID 
的 共享 ， 大 大 降低 了 数据 共享 的 复杂 性 如 图 9-2 所 示 。 





(a) 传统 块 储存 系统 (b) 对 象 储存 系统 
图 9-2 基于 块 的 存储 系统 与 对 象 存储 系统 对 比 
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92.2 ”对 象 存储 基本 定义 


1. 对象 

对 象 Cobject) 是 位 于 对 象 存储 设备 (OSD/object-based storage device) 中 的 一 个 可 
变 长 度 的 有 序 字 节 集合 。 每 个 对 象 都 与 一 个 独一无二 的 标识 符 相 关联 ， 对 象 中 的 数据 通 
过 对 象 的 标识 符 以 及 对 象 内 的 偏 移 量 进行 访问 。 它 是 对 象 存 储 的 基本 单元 。 

对 象 可 以 看 作 是 文件 和 块 的 结合 体 。 类 似 于 文件 ， 对 象 通过 接口 访问 ， 这 使 数据 能 
够 安全 地 在 不 同 平台 之 间 共 享 ; 类 似 于 块 ， 对 象 是 存储 的 基本 单元 ， 可 以 在 存储 设备 中 
直接 访问 ， 不 需要 通过 服务 器 。 能 够 对 存储 设备 进行 直接 的 、 类 文件 的 访问 是 对 象 存 储 
的 主要 优点 。 

SCSI-3 标准 命令 集 定义 了 对 象 存储 设备 OSD) 的 访问 接口 标准 ， 即 OSD-3 标准 。 
OSD-3 标准 根据 对 象 的 不 同 用 途 ， 可 以 将 对 象 进一步 分 为 根 对 象 Croot object) 、 分 区 对 
象 (partition) 、 集 合 对 象 〈《collection) 和 用 户 对 象 Cuser object) 等 ， 如 表 9-1 Artz. 


表 9-1 根据 OSD-3 标准 进一步 划分 对 象 


根 对 象 (root object) 
分 区 对 象 (partition) 


表示 存储 数据 的 OSD WH i 集合 对 象 (collection) 
用 户 对 象 Cuser object) 

相关 数据 属性 (attribute) 

表示 瞬间 应 用 客户 行为 的 OSD WHR OSD 对 象 onpacity) 


证 书 (credential) 


(1) 根 对 象 

一 个 OSD 逻辑 单元 有 且 仅 有 一 个 根 对 象 。 根 对 象 的 属性 描述 了 OSD 逻辑 单元 的 全 局 
特征 , 如 逻辑 单元 的 大 小 、 边 辑 单元 包含 的 分 区 数 等 。 根 对 象 是 OSD 逻辑 单元 的 起 始点 。 

(2) 分 区 对 象 

用 户 对 象 可 以 划分 为 不 同 分 区 ， 每 一 个 分 区 用 一 个 分 区 对 和 象 描述 。 

(3) 用 户 对 象 

用 户 对 象 是 保存 用 户 数据 的 存储 对 象 。 对 象 中 的 数据 通过 字 节 偏 移 量 访问 。 用 户 对 
象 至 多 属于 一 个 分 区 。 

(4) 集合 对 象 

集合 是 另 一 种 划分 用 户 对 象 的 方式 。 每 一 个 集合 对 象 代表 一 个 用 户 对 象 的 集合 ， 它 
隶属 于 某 个 分 区 ， 包 含 此 分 区 中 的 0 个 或 多 个 用 户 对 象 。 

(5) 标识 符 

在 OSD-3 标准 中 ， 每 个 对 象 中 包含 两 个 标识 符 : Partition ID 和 User_ Object ID。 
Partition ID 为 分 区 标识 符 ， 代 表 OSD 逻辑 单元 中 的 一 个 分 区 ; User_Object_ID 为 对 象 
标识 符 ， 每 个 对 和 象 都 与 一 个 独一无二 的 标识 符 相 关联 。 

在 OSD 逻辑 单元 中 ， 通 过 标识 符 的 不 同 组 合 区 分 不 同类 型 的 对 象 ， 如 表 9-2 所 示 。 
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根 对 象 的 Partition ID 和 User_ Object ID 均 为 0; 分 区 对 象 的 Partition_ ID 由 逻辑 单元 分 
配 ，User_ Object ID 为 0; 用 户 对 象 和 集合 对 象 的 Partition ID 为 所 属 的 分 区 号 ， 
User_Object_ID 由 逻辑 单元 分 配 。 


表 9-2 分 区 标识 符 和 对 象 标识 符 的 取 值 


ie ae 用 户 对 象 /集合 对 旬 


2. x RB 

MAIBTE (attribute) 可 以 关联 元 数据 与 任意 类 型 的 对 象 。 它 包含 一 些 对 象 的 详细 特 
征 值 ， 如 对 象 占 有 的 总 字 节 数 、 对 象 最 后 修改 的 时 间 等 。 对 象 属 性 描述 了 对 象 被 访问 的 
方式 ， 给 予 不 同 的 存储 系统 共享 同一 组 描述 数据 的 信息 的 能 力 。 

在 OSD-3 标准 中 ， 对 象 属性 以 页 进行 存储 。 对 象 关联 的 属性 页 (attributes page) 由 
页 号 (attributes page number) 标识 。 整 个 页 号 空间 被 分 为 数 段 ， 每 段 中 的 页 号 标识 的 页 
仅 能 与 特定 类 型 的 对 象 相 关联 。 例 如 ， 页 号 范围 为 0x0 一 0x2FFFFFFF 的 段 仅 能 与 用 户 对 
BRK. 页 号 为 OxFFFFFFFF 的 属性 页 可 以 关联 任意 类 型 的 对 象 。 在 获取 属性 页 的 命令 中 ， 
它 表 示 返 回 属性 页 空间 中 所 有 与 它 类 型 相同 的 属性 页 。 属 性 页 的 页 号 空间 分 段 见 表 9-3。 

表 9-3 属性 页 的 页 号 空间 分 段 











0x0~0x2FFFFFFF 用 户 对 象 
0x30000000~0x5FFFFFFF 分 区 对 象 
0x60000000~0x8FFFFFFF 集合 对 象 
0x90000000 一 0xBFFFFFFF 根 对 象 
0xC0000000~0xEFFFFFFF 保留 
0xF0000000~0xFFFFFFFE 任意 类 型 对 象 

0xFFFFFFFF 任意 类 型 对 象 


同一 个 属性 页 中 的 所 有 属性 拥有 相同 的 源 或 用 户 。 属 性 页 中 的 属性 由 0x0 一 0xFFFFFFE 
的 属性 号 (attribute number) 标 识 。 在 获取 属性 的 过 程 中 , 获取 最 后 一 个 属性 号 OxFFFFFFF 
表示 获取 属性 页 中 的 所 有 属性 。 


9.3 对象 存 储 的 实现 


9.3.1 对象 存 储 系 统 结构 


一 个 典型 的 基于 对 和 象 存储 的 存储 系统 由 用 户 终端 (client)、 元 数据 服务 器 (MDS) 
和 对 象 存储 服务 器 (OSS) 组 成 。 如 图 9-3 所 示 它 们 通过 高 速 以 太 网 或 独立 布线 连接 ， 
基于 标准 SCSI-3 命令 集 进 行 数 据 通信 。 基 于 对 象 存 储 的 存储 系统 结构 如 图 9-4 所 示 。 
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文件 恢复 、 文 件 状态 
修改 、 文 件 创 建 


目录 操作 、 元 数据 
管理 、Cache 一 致 性 









文件 MO、 文件 锁定 













元 数据 处 理 器 
(Meta-Data 
Server, MDS) 
元 数据 储存 设备 
(Meta-Data 
Targets, MDT) 
高 速 以 太 网 
TRESS SS 
(Object Storage 对 象 储存 设备 对 象 
Servers, OSSa) OSS2 (Object Storage 
Targets, OSTs) 





图 9-4 基于 对 和 象 存储 的 存储 系统 


在 存储 系统 运行 时 ， 用 户 终端 首先 癌 元 数据 服务 器 发 送 操作 命令 的 请 求 。 元 数据 服 
务 器 通过 以 下 3 个 步骤 处 理 请 求 。 

C1) 将 用 户 终端 文件 系统 中 的 逻辑 数据 结构 映射 到 对 象 ID。 

(2) 获取 对 象 所 在 的 设备 号 。 

(3) 赋予 命令 权限 认证 。 根 据 元 数据 服务 器 返回 的 信息 ， 用 户 终端 可 以 直接 与 对 象 
存储 服务 器 进行 数据 交换 。 

1. 对 象 存储 系统 的 客户 端 (client) 和 文件 系统 

为 了 使 client 能 够 直接 管理 存储 设备 并 解释 用 户 的 操作 ， 与 对 和 象 存储 设备 (OSD) 
以 及 元 数据 服务 器 (MDS) 进行 通信 以 完成 用 户 操作 ， 对 象 存储 系统 提供 给 用 户 标 准 
POSIX 文件 访问 接口 ， 允 许 其 系统 上 的 应 用 程序 与 标准 文件 系统 操作 无 颖 交流 。 
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2. 元 数据 服务 器 

元 数据 服务 器 (meta-data server, MDS) 是 最 复杂 的 子 系统 。 它 控制 Client 与 OSD 
之 间 的 交互 ， 同 时 对 设备 内 对 象 的 元 数据 进行 综合 管理 ， 具 体 为 :维护 整个 系统 的 目录 结 
构 与 权限 控制 ， 包 括 限额 控制 、 目 录 和 文件 的 创建 和 删除 、 访 问 控制 等 ， 提 供 全 局 的 命名 空 
间 , 为 客户 端 提 供 统 一 的 文件 逻辑 视图 , 允许 Client 直接 访问 对 象 。MDS 提供 以 下 功能 : 

(1) 存储 对 象 访 问 。 在 对 象 存储 系统 中 ，MDS 将 存储 文件 的 目录 结构 提供 给 客户 端 。 当 
用 户 通 过 客户 端 请 求 对 特定 文件 执行 操作 时 ，MDS 会 给 出 一 个 与 此 文件 相关 的 OSD 映射 列 
表 ， 同 时 给 出 客户 端 操 作 认 证 〈capacity) 。OSD 将 根据 此 认证 决定 是 否 同 客 户 端 提供 服务 。 

(2) client cache 一 致 性 维护 。 对 象 存储 系统 中 利用 客户 端 cache 来 提升 系统 性 能 。 
由 于 引入 client 端 cache， 带 来 了 cache 一 致 性 问题 。MDS 提供 分 布 的 锁 机 制 来 保证 整个 
系统 的 cache 一 致 性 。 

(3) 负载 平衡 。MDS 管理 整个 对 象 存 储 系统 中 的 数据 传输 负载 。 当 用 户 申请 文件 存 
(HEREIN, ICAP vile] MDS 申请 存储 空间 ，MDS 创建 目录 并 分 配 OSD， 然 后 给 出 权限 
写 入 文件 ,在 分 配 OSD 的 过 程 中 , MDS 可 以 根据 整个 系统 的 负载 以 及 系统 中 对 象 在 各 OSD 
中 的 分 布 ， 合 理 地 分 配对 象 存 储 设备 ， 尽 量 使 对 象 在 各 OSD 中 均匀 分 布 。MDS 可 以 设计 算 
法 预测 对 象 的 热度 ， 对 热点 对 象 进行 复制 ， 由 多 个 OSD 向 客户 端 提供 服务 ， 以 提高 带宽 利 
Fl. MDS 常用 的 负载 均衡 算法 有 轮转 法 、 散 列 〈hash) 法 、 最 少 连接 法 、 最 低 缺 失 法 等 。 

元 数据 服务 器 软件 模块 分 为 5 层 ， 如 图 9-5 所 示 。 最 底层 为 Ex3 或 者 其 他 格式 的 文 
件 储存 系统 ; 在 其 上 为 相应 文件 系统 的 API 层 , 目的 是 同上 层 提供 可 供 操作 的 调用 接口 ; 
API 层 以 上 为 驱动 层 ， 保 证 上 层 服 务 器 可 以 与 下 层 硬件 设备 进行 通信 ; 在 驱动 层 上 方 是 
服务 器 层 与 应 用 层 ， 将 内 部 信息 封装 起 来 向 其 他 模块 提供 数据 的 联网 与 恢复 服务 。 

3. 对 象 存 储 设备 

基于 对 象 存 储 的 概念 。 对 象 能 够 被 作为 结 点 并 用 来 存储 文件 数据 。 一 个 对 象 存 储 服 
94s (object storage server, OSS) 是 一 个 运行 在 相关 文件 系统 上 的 服务 器 节点 。 它 拥有 
一 个 或 多 个 网 络 接口 , 通常 拥有 一 个 或 多 个 磁盘 。 每 个 OSS 导出 一 个 或 多 个 对 象 存储 目 
标 Cobject storage targets, OST) 。 

OST Ht FASE DAG, Ab P mA AS A. OST 将 对 象 数据 分 配 
并 存 入 OSD, Æ OSD 机 群 的 抽象 化 。OSS 的 相关 软件 模块 如 图 9-6 所 示 。 





Network & Recovery Network & Recovery 
OSD Driver 
LVFS apilayer* LVFS apilayer* 
Backend: Ex3 & others Disk Backend: Ex3 & others Disk 
subsystem subsystem 
9-5 MDS 的 软件 模块 图 9-6 OSS 的 软件 模块 
4. 对 象 存储 设备 


每 一 个 对 象 存储 设备 (object storage device, OSD) 都 是 智能 设备 , 具有 自己 的 磁盘 、 
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处 理 器 、RAM 内 存 以 及 网 络 接口 ， 负 责 管理 本 地 的 对 象 数 据 。OSD 是 对 和 象 存储 体系 的 
基础 。 与 传统 块 存储 设备 的 不 同 之 处 是 OSD 为 用 户 提供 的 命令 接口 , 包括 创建 与 删除 对 
象 、 对 单个 对 象 内 数据 的 读 和 写 、 设 置 或 读 取 对 象 的 属性 。 同 时 提供 了 对 每 个 对 象 的 每 
个 命令 进行 访问 控制 的 安全 机 人 制 。 

OSD 在 对 象 存储 系统 中 的 主要 功能 有 以 下 3 个 方面 。 

(1) 存储 数据 。 作 为 存储 设备 ，OSD 也 必须 管理 布局 在 标准 磁道 和 扇 区 上 的 数据 ， 
这 些 数 据 只 能 通过 它们 的 对 象 ID 来 访问 ， 但 无 法 通过 “ 块 ” 的 形式 被 找到 ， 即 OSD 只 
提供 “对 象 ” 一 级 的 接口 ， 客 户 端 访 问 OSD 时 ， 需 提供 特定 对 象 的 ID、 请 求 读 写 的 数据 
在 对 象 内 的 偏 移 地 址 、 输 出 数据 时 连续 段 的 长 度 以 及 设备 权能 ， 才 能 访问 对 象 中 的 数据 。 

(2) 智能 分 布 。OSD 利用 自身 的 处 理 器 和 内 存 优化 数据 分 布 ， 并 且 文 持 数 据 的 预 读 
HY (pre-fetching)。 在 对 象 中 利用 属性 (attribute〉 来 定义 负载 需求 ， 这 些 需求 包括 访问 
类 型 、 读 写 模 式 、 请 求 块 大 小 等 。 设 备 通过 一 个 属性 映射 〈attribute mapping) 引擎 分 析 
己 有 的 对 象 属性 来 制定 相应 的 布局 策略 ， 有 针对 性 地 将 数据 映射 到 设备 ， 以 满足 相关 需 
求 目 标 。 

(3) 元 数据 管理 。OSD 管理 其 上 存储 的 对 和 象 的 相关 元 数据 。 这 些 元 数据 与 块 存储 设 
备 中 的 元 数据 类 似 ， 包 含 了 对 象 内 数据 在 磁盘 上 的 逻辑 分 布 、 时 间 戳 、 数 据 块 的 长 度 和 
对 象 的 长 度 等 OSD 通过 管理 自身 内 对 象 的 元 数据 来 减轻 元 数据 服务 器 (MDS ) 的 负担 。 


93.2 T10 与 SCSI-3 标准 命令 集 


随 着 对 象 存 储 逐 渐 走 向 标准 化 ， 以 CMU NASD 项 目 为 基础 ， 卡 耐 基 梅 隆 大 学 在 美 
国 存 储 工业 联盟 (National Storage Industry Consortium) 的 组 织 下 创建 了 T10 工作 组 。 现 
在 ，T10【〈 参 见 http://www.tl0.org) 是 信息 技术 标准 国际 委员 会 (International Committee 
on Information Technology Standards, INCITS) 的 一 个 分 支 机 构 ， 其 主要 职责 是 为 SCSI 
接口 制订 国际 标准 。T10 制订 的 SCSI 存储 标准 包括 一 系列 SCSI 标准 命令 集 ( 当 前 为 
SCSI-3 标准 命令 集 ) ， 如 SPC-4、SBC-3、SSC-4、MMC-6、SMC-3 和 OSD-3 等 。 这 些 
命令 集 被 广泛 运用 于 各 种 现代 的 IO 接口 中 , 包括 SCSI 接口 、 串 行 SCSI (Serial Attached 
SCSI, SAS) 接口 、 光 纤 通 道 (Fibre Channel, FC) 接口 、 串 行 存储 架构 (Serial Storage 
Architecture，SSA) 、IEEE1394 接口 、USB 接口 和 ATA/ATAPI (AT attachment packet 
interface) 接口 等 。 

SCSI-3 标准 命令 集 定 义 了 对 象 存储 设备 OSD 的 访问 接口 标准 ， 即 OSD-3 标准 。 
OSD-3 标准 将 存储 对 象 定义 为 一 个 有 序 的 字 节 集合 ， 采 用 唯一 的 标识 符 与 之 对 应 。 将 对 
象 分 配 并 放置 在 OSD 设备 的 逻辑 单元 上 ， 通 过 标识 符 和 对 象 内 部 的 偏 移 地 址 进行 访问 。 

在 OSD-3 标准 中 共 定 义 了 23 种 基本 命令 。 基 本 命令 通过 命令 描述 块 (command 
description block, CDB) 来 定义 ， 并 进行 了 大 幅 扩展 ， 从 SCSI 命令 原 有 的 10 字 节 扩展 
为 236 字 节 (可 变 长 ) 。0OSD-3 标准 中 的 命令 描述 块 CDB 如 表 9-4 Pras, 常见 参数 如 下 。 

PARTITION ID: 对 象 所 在 的 分 区 对 象 标 识 符 。 

USER OBJECT ID: 用 户 对 象 标识 符 ， 是 OSD 中 全 局 唯一 的 对 象 标 识 符 。 

LENGTH or ALLOCATION LENGTH: 读 写 命令 请 求 传输 的 字 节 数 或 分 配 的 字 节 数 。 

STARTING BYTE ADDRESS: 请 求 读 写 的 数据 在 对 象 内 的 偏 移 地 址 。 
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CDB CONTINUATION LENGTH: 数据 输出 时 CDB 连续 段 的 长 度 。 

Get and set attributes parameters: 获取 /设置 属性 参数 ， 与 GET/SET CDBFMT 控制 位 
结合 ， 说 明 该 命令 需要 存储 的 属性 或 者 属性 列表 。 

Capability: OSD 设备 的 权能 , 根据 权能 来 验证 客户 端 是 否 执行 该 命令 所 赋予 的 权限 。 

Security parameters: 安全 性 参数 ， 用 于 验证 命令 的 完整 性 。 


表 9-4 OSD-3 标准 中 的 命令 描述 块 CDB 





0 | | 操作 码 OPERATION CODE (7Fh) 





1 控制 CONTROL 
2~6 保留 Reversed 
7 附加 CBD 长 度 ADDITIONAL CDB LENGTH (228) 
8 一 9 服务 行为 SERVICE ACTION 
| DPO_| BUA | 隔离 ISOLATION 


GET/SET 
IMMED TR CDBFMT 命令 特定 选项 Command specific options 


时 间 玲 控制 TIMESTAMPS CONTROL 


13 一 15 保留 Reversed 

16 一 23 PARTITION ID 

24~31 USER_OBJECT ID 

32~39 LENGTH or ALLOCATION LENGTH 
40~47 STARTING BYTE ADDRESS 

48~51 CDB CONTINUATION LENGTH 

52~79 获取 /设置 属性 参数 Get and set attributes parameters 
80 一 183 OSD 设备 的 权能 Capacity 
184~235 安全 性 参数 Security Parameters 


94 ”对象 存储 的 优点 


94.1 对象 存储 解决 信息 丢失 


随 着 网 络 存 储 技 术 的 发 展 ， 系 统 对 接口 (interface) 提出 了 更 多 的 要 求 ， 以 适应 日 
益 增 长 的 存储 需求 。 自 磁盘 驱动 器 诞生 以 来 ， 磁 盘 密 度 及 其 性 能 都 在 飞速 增长 ， 而 其 存 
/ 统 
从 基于 数据 块 的 接口 (如 小 型 微型 计算 机 接口 (small computer system interface, SCSI) ， 
中 获 益 菲 浅 ， 但 它 却 成 为 制约 存储 系统 性 能 提升 的 重要 因素 。 接 口 的 存在 ， 使 得 主机 和 
存储 设备 都 隐藏 了 很 多 各 自 的 信息 ， 无 论 上 层 的 应 用 请 求 具 备 如 何 丰富 的 语义 ， 到 达 系 
统 底层 的 永远 都 是 请 求 地 址 等 信息 。 上 层 的 信息 在 底层 无 法 表达 ， 该 现象 称 为 “信息 丢 
失 ” 现 象 ， 如 图 9-7 所 示 。 
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应 有 | GLP RPapseam Dab X Web To XP a Ee 
读 写 需 


求 _) 





a i = i 


驱动 层 CTD 设备 驱动 


(设备 号 、 块 号 …) 


图 9-7 传统 存储 系统 的 “信息 丢失 ”现象 


用 户 向 P2P 流 处 理应 用 发 送 的 顺序 大 块 数据 请 求 ， 经 过 文件 系统 和 设备 驱动 到 达 存 
储 设备 时 ， 信 息 已 变 成 设备 号 和 块 号 ;用户 向 网 页 文本 应 用 发 送 的 随机 小 数据 请 求 ， 在 
经 过 文件 系统 和 设备 驱动 之 后 ， 到 达 存 储 设备 的 也 变 成 了 设备 号 和 块 号 。 同 样 地 ， 即 使 
用 户 对 某 些 数据 有 着 特殊 的 可 靠 性 或 安全 性 的 要 求 ， 到 达 底 层 存 储 设备 的 信息 ， 也 只 能 
是 设备 号 和 块 号 。 随 着 存储 系统 规模 和 复杂 度 的 不 断 增 长 ， 存 储 设 备 及 配置 选项 的 日 益 
复杂 ， 存 储 系统 管理 员 将 面临 越 来 越 大 的 压力 。 

为 解决 信息 丢失 问题 ， 对 和 象 存储 系统 引入 了 “属性 管理 ”概念 ， 将 属性 作为 描述 数 
据 的 信息 ， 一 同 封装 入 “对 象 ” 中。 通常 来 讲 ， 属 性 能 够 描述 对 象 特点 ， 或 者 记录 对 象 
的 历史 行为 。 通过 属性 信息 , OSD 能 够 实现 对 其 上 数据 的 目 管理 。 通 过 合理 的 设计 算法 ， 
对 用 户 访问 对 象 存 储 设备 的 规律 进行 智能 学 习 ， 提 高 对 象 存储 设备 的 预 读 取 命 中 率 ， 从 
而 提高 对 象 存储 设备 的 性 能 。 


94.2 ”对 象 存 储 集合 了 NAS, SAN 的 优点 


随 着 计算 机 技术 及 其 相关 网 络 应 用 的 飞速 发 展 ， 网 络 传输 信息 量 的 不 断 膨胀 ， 人 们 
对 网 络 存储 的 需求 也 日 益 增 多 ， 存 储 系统 不 再 是 计算 机 系统 的 附属 设备 ， 而 成 为 互联 网 
中 与 计算 和 传输 同等 重要 的 三 大 基石 之 一 ， 网 络 存 储 已 成 长 为 信息 化 的 核心 发 展 领域 ， 
并 逐渐 承担 信息 化 核心 的 重任 。 其 中 NAS、SAN 作为 两 类 广泛 应 用 的 网 络 存储 方式 ， 选 
择 它 们 作为 对 比 的 对 象 有 着 重要 意义 。 下 面 分 别 介绍 其 差异 。 

1. NAS 与 OBS 

网 络 附加 存储 (NAS) 是 一 种 将 分 布 、 独 立 的 数据 整合 为 大 型 、 集 中 化 管理 的 数据 
中 心 , 以 便于 对 不 同 主机 和 应 用 服务 器 进行 访问 的 技术 。 NAS 本 身 能 够 支持 多 种 协议 (如 
NFS、CIFS、FTP、HTTP 等 ) ， 而 且 能 够 支持 各 种 操作 系统 ， 可 提供 路 平台 文件 共享 功 
能 。 通 过 任何 一 台 工 作 站 ， 采 用 Web 浏览 器 就 可 以 直观 方便 地 管理 NAS 设备 。NAS X 
件 系 统 概念 图 如 图 9-8 所 示 。 

NAS 的 优势 表现 在 以 下 几 个 方面 。 

。 高 可 扩展 性 : NAS 在 网 络 中 的 框架 没有 限制 ， 系 统管 理 人 员 可 以 根据 网 络 系统 

一 对 数据 存储 的 需求 和 网 络 中 的 流量 动态 设置 NAS 设备 。 扩 展 NAS MAAN, R 


196 


信息 存储 与 IT 管理 


要 简单 地 修改 配置 、 添 加 节点 ，NAS 设备 接 入 网 络 即 可 。 


Linux/Unix 用 户 Windows 用 户 






Le a ee = TCP/IP 网 络 


AG 
Hi 
和 


文件 服务 器 应 用 服务 器 MAS 存储 设备 
图 9-8 NAS 文件 系统 概念 图 
数据 的 高 度 兼 容 性 与 共享 性 : NAS 对 外 界 的 接口 通常 是 文件 。 通 过 使 用 标准 协 
X TAKAR AH NAS 产品 集中 在 一 起 。 目 前 ，NAS 设备 不 仅 支 持 多 种 操 
VERB (UNIX、Linux、Windows 等 ) ， 而 且 支 持 多 种 网 络 协议 《TCP/IP 等 ) ， 
使 NAS 支持 多 系统 间 的 数据 共享 。 


。 通用 服务 器 的 低 负 人 荷 : NAS 在 一 定 程 度 上 可 以 目 行 管理 其 上 的 文件 ， 因 此 网 络 上 的 


其 他 服务 器 不 需 再 对 存储 设备 进行 管理 ， 可 以 将 更 多 的 资源 用 于 其 他 系统 工作 。 


NAS 的 缺陷 如 下 。 


网 络 带 宽 问 题 : NAS 使 用 LAN 进行 数据 传输 ， 因 此 受 限于 企业 的 网 络 带 宽 ， 当 
同一 企业 的 多 台 主 机 同时 访问 NAS 网 络 时 ，NAS 的 性 能 会 大 幅 下 降 , 甚至 会 出 
现 不 能 满足 用 户 需 求 的 情况 。 

元 数据 处 理 瓶 颈 : NAS 的 文件 数据 存放 在 多 个 节点 上 ， 由 NAS 服务 器 对 元 数据 
进行 管理 ， 随 着 现今 数据 的 爆炸 性 增长 ，NAS 服务 器 需要 处 理 越 来 越 多 的 元 数 
据 ， 因 此 ， 元 数据 的 处 理性 能 逐渐 成 为 制约 NAS 存储 规模 的 瓶颈 。 

由 协议 引起 的 IO 性 能 不 佳 : NAS 与 外 界 的 接口 为 文件 ， 使 用 通用 协议 在 LAN 
上 进行 数据 传输 ,因此 文件 的 存 取 都 需 经 过 协议 的 包装 ， 随 之 带 来 了 协议 开销 和 
通信 延迟 ， 这 使 得 NAS 在 高 性 能 IO 集群 中 表现 不 佳 。 


NAS 与 OBS 的 区 别 如 下 。 


2 


可 扩展 性 方面 : 同 为 网 络 存储 系统 ，NAS 与 OBS 都 是 基于 LAN 一 级 的 文件 协 
议 进 行 数据 传输 ，OBS 进行 扩展 的 方式 与 NAS 类似， 只 需 简 单 修改 配置 、 添 加 
WR. OSD 接 入 网 络 即 可 ， 两 者 都 具有 非常 好 的 可 扩展 性 。 

提供 服务 方式 上 : NAS 提供 的 是 文件 级 的 传输 服务 ， 文 件 系统 创立 在 NAS 设备 
E; OBS 通过 向 OSD 提交 对 象 ID、 偏 移 量 和 提取 数据 长 度 对 数据 进行 读 取 ， 文 
件 系统 存在 于 主机 方 。 

元 数据 处 理 方面 : NAS 的 文件 系统 建立 在 NAS H, 在 存储 节点 增多 时 面临 瓶颈 ; 
OBS 中 90% 的 元 数据 存储 在 OSD F, 由 设备 自行 管理 , 不 存在 元 数据 处 理 瓶 颈 。 
SAN 与 OBS 


存储 局 域 网 CSAN) 是 一 种 独立 于 业务 网 络 系统 之 外 的 高 速 存储 网 络 或 子 网 络 。 存 
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储 设 备 是 一 台 或 多 台 用 以 存储 计算 机 数据 的 磁盘 设备 , 主要 采用 光纤 通道 作为 传输 媒体 ， 
同时 应 用 SCSI 或 iSCSI 两 种 以 太 网 协议 作为 存储 访问 协议 。SAN 以 块 作为 基本 访问 单 
位 ， 实 现 了 高 速 共享 存储 目标 如 图 9-9 所 示 。 


PC 端 


SAN 服务 器 





SAN-Storage Area Network 


SAN 储存 阵列 





9-9 ”传统 SAN 工作 概念 图 


SAN 的 优势 如 下 。 
。 高 可 用 性 能 :封装 于 光纤 通道 协议 (FCP) 的 块 级 访问 协议 SCSI 是 从 存储 网 


络 到 服务 器 之 间 , 数据 传输 效率 最 高 的 协议 。 同 时 存储 网 络 内 部 使 用 光纤 进行 通 
信 ， 保 证 了 高 带宽 带 来 的 高 性 能 。 

提高 了 数据 的 安全 性 和 可 靠 性 : SAN 以 独 有 的 机 制 建立 了 存储 网 络 到 客户 端的 多 条 
通路 ， 提 高 了 数据 的 可 靠 性 ，SAN 也 可 以 实现 虚拟 网 络 ， 以 保证 数据 的 安全 性 。 
扩展 性 与 兼容 : SAN 网 络 除了 支持 RAID 设备 外 ， 还 支持 卫 OD、 磁 带 存储 设备 等 
多 种 设备 , 通过 统一 的 SCSI 协议 将 存储 设备 接 入 SAN 网络， 目前 SAN 的 升级 设备 
能 够 保证 癌 下 兼容 ， 在 提升 网 络 性 能 的 同时 ,确保 以 前 设备 的 兼容 性 和 投资 有 效 性 。 


SAN 的 缺陷 如 下 。 


高 成 本 : SAN 网 络 的 主要 连接 方式 是 光纤 通道 ， 专 用 的 光纤 通道 、 交 换 机 和 管 
理 软 件 带 来 了 较 高 的 成 本 ， 随 着 现今 需要 处 理 存储 的 数据 急剧 增长 ，SAN 的 规 
模 越 来 越 大 ， 相 应 的 支出 也 将 越 来 越 高 。 

传统 框架 带 来 的 扩展 困难 : 虽然 SAN 的 硬件 设施 能 够 做 到 可 扩展 与 兼容 性 ， 但 
是 传统 SAN 基于 硬性 框架 ， 存 储 阵 列 独立 于 LAN， 需 要 在 数据 中 心 自行 布线 ， 
由 主机 控制 硬盘 配置 ， 属 于 一 种 静态 的 配置 。 用 户 在 配置 SAN 时 ， 预 留 的 扩展 
空间 基本 已 经 确定 , 随 着 今后 对 数据 存储 要 求 的 提高 , 这 种 缺乏 弹性 的 框架 将 成 
为 SAN 的 一 大 问题 。 


SAN 5 OBS 的 区 别 如 下 。 


数据 访问 方面 : SAN 面向 用 户 提供 块 一 级 数据 的 传输 , 数据 传输 效率 很 高 ; OBS 
面向 用 户 提 供 对 和 象 一 级 数据 的 传输 ， 数 据 传 输 效率 较 高 。 
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数据 安全 方面 : SAN 通过 采用 专用 的 存储 网 络 隐藏 原始 数据 ， 提 供 虚 拟 数 据 网 
络 与 用 户 进行 数据 交流 ;: OBS 通过 对 象 封装 原始 数据 ， 只 有 使 用 MDS 给 出 的 认 
证 (capacity) ， 才 能 读 取 数据 。 两 者 都 具有 较 高 的 安全 性 。 


. OBS 技术 特点 


OSD 智能 化 。OSD 独 有 的 属性 管理 和 元 数据 管理 使 得 存储 设备 智能 化 ， 一 方面 
提升 了 设备 性 能 ， 另 一 方面 降低 了 整个 系统 的 管理 负担 。 

性 能 优势 。 定 义 属性 来 描述 负载 需求 ， 通 过 OSD 内 部 运算 实现 数据 预 读 取 和 访 
问 并 行 化 ， 可 以 最 大 限度 地 利用 网 络 的 带宽 ， 提 高 应 用 的 存储 能 力 。 

高 数据 共享 。 在 对 和 象 存储 系统 中 , 任何 客户 端 都 可 以 通过 访问 提供 的 标准 文件 接 
口 ， 访 问 存储 设备 上 的 数据 ， 同 时 提供 cache 一 致 性 策略 ， 保 证 客户 端 访 问 数据 
的 一 致 ， 使 文件 级 的 数据 共享 更 容易 。 

易 管理 特性 。OSD 将 基础 数据 的 元 数据 存放 在 设备 上 自行 管理 。 管 理 员 只 需要 
关注 存储 系统 的 逻辑 视图 ， 不 需要 知道 设备 的 细节 。 此 外 ，OSD 的 智能 化 使 其 


.可 以 统计 应 用 访问 模式 , 并 根据 统计 结果 更 有 效 地 组 织 对 和 象 , 提高 设备 的 空间 利 


用 效率 和 访问 效率 。 
数据 安全 性 。 将 原始 数据 封装 入 Object， 只 有 获得 元 数据 处 理 器 的 认证 ,才能 执 
行 用 户 访问 。 


对 象 存储 与 传统 存储 对 比 见 表 9-5。 
表 9-5 对 象 存 储 与 传统 存储 对 比 





vat be 块 存储 设备 高 性 能 ， 高 安全 成 本 高 ， 扩 展 性 一 般 


文件 存储 〈 代 
表 NAS) 


对 象 存储 对 象 存储 设备 + 管 | 高 并 行 性 ， 高 性 能 ， 良 | 处 于 发 展 阶段 ， 相 应 的 
(OBS) 好 的 可 扩展 性 软 硬 件 支 持 不 完善 












块 存储 设备 + 文件 | 高 扩展 性 ， 易 管理 ， 低 | 带宽 低 ， 延 迟 大 ， 元 数 
系统 成 本 据 瓶 颈 
理 程 序 
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完成 本 章 学 习 ， 将 能 够 : 


了 解 对 象 储 存 的 发 展 历史 。 

BMA RAMS OTR. OSD, MDS 等 )。 

掌握 OBS 的 组 成 与 结构 ， 熟 悉 OBS 内 部 各 构件 的 功能 与 关系 。 
掌握 OBS 相对 于 传统 存储 结构 的 优点 。 


9.6 练习 题 
一 、 选 择 题 


| he 


对 和 象 存储 系统 与 传统 块 存储 系统 的 根本 不 同 是 (  )。 
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A. 对 象 存储 系统 可 以 管理 元 数据 

B. 对 象 存储 系统 提供 对 象 一 级 的 接口 
C. 对 象 存储 系统 具有 高 数据 共享 性 
D. 对 象 存储 系统 起 步 较 晚 


答案 (B) 
2. 根据 OSD-3 标准 ， 以 下 ( ) 对 象 类 型 不 是 对 OBS 中 对 象 的 分 类 。 
A. 根 对 象 B. 集合 对 象 C. 用 户 对 象 D. 数据 对 象 
答案 (D) 
3. 下 列 关 于 对 象 存 储 设备 (OSD), 描述 正确 的 是 【 5 
A. OSD 是 智能 设备 B. OSD 是 块 设备 
C. OSD 内 部 不 存在 处 理 系 统 D. OSD 安全 性 较 差 
答案 (A) 
4. 以 下 不 属于 元 数据 处 理 器 的 工作 的 是 ( Jo 
A. 负载 平衡 B. cache 一 致 性 维护 
C. 通过 网 络 与 用 户 进 行 交 流 D. 存储 对 象 访 问 
ER (C) 
5. OBS 相 较 NAS 的 优势 在 于 ( De 
A. 突破 元 数据 瓶颈 B. 更 高 的 可 扩展 性 
C. 更 易 接 入 网 络 D. 极 大 的 带宽 优势 
答案 (A) 
6. 基于 对 和 象 存储 的 文件 系统 中 的 模块 包含 X; 
A. 客户 端 B. 元 数据 处 理 器 
C. 对 象 存 储 服务 器 D. 监视 器 
答案 (D) 


7. 对 数据 存储 服务 器 (OSS) 的 描述 ， 错 误 的 是 〈 Jo 
A. OSS 通常 拥有 一 个 或 多 个 网 络 接口 
B. OSS 通常 拥有 一 个 或 多 个 磁盘 
C. 每 个 OSS 导出 一 个 或 多 个 对 象 存储 目标 
D. OSS 通常 使 用 多 种 命令 集 


答案 (D) 

8. SCSI-3 标准 命令 集 定 义 的 对 象 存储 设备 OSD 的 访问 接口 标准 是 ( ys 
A. OSD-3 标准 B. OSD-4 标准 C. OSD-5 标准 D. OSS-4 标准 

答案 (A) 

二 、 简 答题 


1. 简要 描述 基于 对 象 储存 的 文件 系统 是 怎样 工作 的 ， 画 出 其 中 各 主要 构件 的 关 
系 图 。 

2. 什么 是 信息 丢失 问题 ? 对 象 储存 如 何 解决 传统 块 储存 设备 中 出 现 的 “信息 丢失 ” 
问题 ? 
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虚拟 化 概述 

虚拟 化 的 分 类 

存储 虚拟 化 的 类 型 

存储 虚拟 化 技术 

云 存 储 虚 拟 化 技术 

华为 存储 虚拟 化 产品 与 应 用 
本 章 总 结 

练习 题 





关于 本 章 


虚拟 化 是 一 个 涵盖 范围 非常 广泛 的 概念 ， 它 的 存在 ， 往 往 是 出 于 简化 管理 、 优 化 资源 使 
用 的 目的 。 简 单 而 言 ， 虚 拟 化 即 是 通过 一 个 软件 抽象 层 ， 将 硬件 平台 划分 为 一 个 或 多 个 虚拟 
机 ， 每 个 虚拟 机 都 与 下 层 硬 件 足 够 相似 ， 可 以 无 差别 地 文 持 软件 运行 。 本 章 主 要 介绍 虚拟 化 
的 概念 、 发 展 历 程 、 前 景 和 趋势 ， 并 对 虚拟 化 技术 做 了 简单 的 分 类 ， 之 后 详细 、 系 统 介 绍 存 
储 虚拟 化 的 技术 细节 。 通 过 本 章 的 学 习 ， 希望 读者 能 了 解 存储 虚拟 化 的 基本 架构 。 
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10.1 虚拟 化 概述 


本 节 将 主要 介绍 虚拟 化 的 背景 、 发 展 历 程 、 发 展 前 景 和 趋势 。 
10.1.1 虚拟 化 概念 


虚拟 化 是 一 个 涵盖 范围 非常 广泛 的 概念 ， 它 的 存在 ， 往 往 是 出 于 简化 管理 、 优 化 资 
源 使 用 的 目的 。 简 单 而 言 ， 虚 拟 化 即 是 通过 一 个 软件 抽象 层 ， 将 硬件 平台 划分 为 一 个 或 
多 个 虚拟 机 ， 每 个 虚拟 机 都 与 下 层 硬 件 足够 相似 ， 可 以 无 差别 地 支持 软件 运行 。 一 个 形 
象 的 例子 就 是 ， 将 基础 的 物理 资源 比 作 一 峡 大 厦 ， 虚 拟 化 就 是 针对 不 同 的 用 户 需求 ， 可 
以 弹性 分 配 及 变换 的 用 户 个 人 工作 空间 。 通 过 这 种 方式 ， 可 以 将 有 限 而 固定 的 资源 ， 通 
过 不 同 的 需求 进行 适度 规划 ， 使 整体 资源 利用 率 得 到 显著 提高 。 

虚拟 化 技术 广泛 存在 于 IT 领域 中 ,针对 不 同 的 资源 ， 有 着 不 同 的 虚拟 化 技术 。 大 致 
上 可 以 分 为 以 下 几 类 。 

。 内 存 虚拟 化 。 

。 网 络 虚拟 化 。 

。 服务 器 虚拟 化 。 

。 存储 虚拟 化 。 

诸如 VMware Workstation 等 广 为 大 众 所 接 触 的 虚拟 效果 软件 ， 使 我 们 对 虚拟 化 技术 
有 了 感性 认 知 。 但 严格 来 看 ， 虚 拟 化 技术 并 不 简单 地 是 一 个 能 实现 虚拟 效果 的 软件 ， 它 
在 技术 层面 的 进步 与 追求 具体 表现 在 减少 虚拟 机 的 相关 开销 ， 实 现 更 深层 、 更 底层 的 虚 
拟 化 《诸如 内 存 和 存储 的 虚拟 化 )， 同 时 也 能 更 广泛 地 支持 各 种 操作 系统 。 

虚拟 化 为 计算 能 力 、 存 储 资源 以 及 网 络 等 其 他 资源 提供 了 一 个 新 的 逻辑 视图 ， 这 种 
资源 的 逻辑 视图 ， 并 不 会 被 底层 物理 资源 的 配置 情况 、 地 理 位 置 和 具体 实现 限制 。 它 能 
够 使 资源 相对 于 原始 配置 而 言 ， 处 在 更 加 有 效 的 利用 状态 下 。 


10.1.2 ”虚拟 化 的 发 展 和 趋势 


1. 虚拟 化 的 起 源 和 发 展 

对 虚拟 化 历史 的 追溯 可 以 从 上 个 世纪 开始 ，IBM 在 20 世纪 60 年 代 开 发 其 System/ 
360™ Model 67 大 型 机 时 ， 就 对 其 所 有 的 硬件 接口 进行 了 虚拟 化 。x86 平台 上 的 虚拟 化 
技术 起 步 很 晚 ， 但 是 随 着 x86 在 市 场 上 的 巨大 成 功 ，x86 平台 上 的 虚拟 化 技术 得 到 了 长 足 的 
发 展 。 尤 其 是 在 CPU 虚拟 化 技术 出 现 后 ，x86 改变 了 其 对 虚拟 化 支持 不 佳 的 一 贯 形象 。 

根据 实现 虚拟 化 的 代价 ， 可 以 将 虚拟 化 的 发 展 历程 分 为 两 个 阶段 。 

(1) 初级 阶段 : 在 虚拟 化 的 早期 ， 人 们 着 重 于 利用 软件 模拟 出 计算 机 的 硬件 和 软件 。 
它 的 实现 是 借助 于 引入 的 模拟 层 : 模拟 层 与 操作 系统 对 话 ， 操 作 系统 则 实现 了 与 硬件 的 
实际 交互 。 处 在 模拟 层 之 上 的 软件 或 者 虚拟 化 出 的 操作 系统 ， 并 不 知道 自己 实际 运行 在 
模拟 层 之 上 。 从 其 工作 机 理 不 难看 出 ， 这 种 虚拟 化 要 付出 巨大 的 性 能 代价 。 

(2) 高 级 阶段 : 针对 早期 虚拟 化 的 缺陷 ， 在 技术 不 断 进步 的 前 提 下 ， 人 们 越 来 越 注 
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重 提高 虚拟 化 的 性 能 表现 ， 虚 拟 化 技术 的 发 展 也 进入 高 级 阶段 。 在 模拟 层 〈 负 责 虚 拟 机 
器 的 指令 转译 ) 和 硬件 之 间 ， 并 不 需要 再 借助 操作 系统 的 干预 ， 虚 拟 化 技术 主要 基于 系 
统 的 物理 硬件 来 提升 系统 的 整体 性 能 。 

2. 虚拟 化 的 优势 

虚拟 化 为 资源 分 配 管理 带 来 了 巨大 的 优势 ， 这 些 优点 则 在 虚拟 化 的 发 展 中 得 到 了 不 
断 的 深化 和 提高 ， 其 主要 集中 在 以 下 几 点 。 

(1) 提高 资源 的 利用 率 。 

(2) 缩减 物理 基础 架构 和 管理 人 员 规 模 ， 节 省 开支 。 

(3) 增加 硬件 和 软件 的 结合 程度 ， 提 高 业务 的 可 拓展 性 和 连续 性 。 

(4) 增强 物理 硬件 的 灵活 性 ， 适 应 上 层 软 件 变化 。 

同时 ， 由 于 虚拟 化 的 技术 特点 ， 它 可 以 很 好 地 同 当前 的 云 计 算 技术 结合 ， 为 信息 产 
业 注 入 新 的 活力 。 

3. 虚拟 化 面临 的 挑战 

在 为 虚拟 化 带 来 的 技术 优势 感到 欢欣 的 同时 ， 我 们 也 需要 正视 虚拟 化 面临 的 诸多 挑 
战 。 虚 拟 化 发 展 面临 的 挑战 主要 集中 在 以 下 两 个 方面 。 

C1) 硬件 使 用 效率 : 如 何在 多 机 模式 下 ， 尽 可 能 地 发 挥 硬件 的 效率 ， 仍 是 个 显著 的 问 
题 。 同 时 ， 尽 管 虚拟 层 可 以 直接 和 物理 层 交 互 ， 其 性 能 还 是 无 法 和 操作 系统 层 相同 。 

(2) 安全 性 问题 : 由 于 虚拟 层 能 够 与 底层 硬件 进行 交互 ， 因 而 安全 就 成 为 了 同性 能 
同等 重要 的 问题 。 虚 拟 化 技术 通常 面向 多 用 户 环境 ， 因 而 其 面临 的 安全 风险 也 更 大 。 

在 软 硬 件 管理 开销 逐年 增加 的 今天 , 虚拟 化 能 有 效 降低 管理 成 本 , 提高 系统 利用 率 。 
虚拟 化 技术 能 实现 资源 的 动态 部 署 和 分 配 ， 满 足 企业 或 用 户 复杂 而 多 样 化 的 需求 。 虚 拟 
化 技术 给 系统 带 来 了 更 高 的 安全 性 、 可 用 性 和 可 扩展 性 。 但 是 目前 虚拟 化 技术 还 不 完善 ， 
如 虚拟 化 引入 的 性 能 开销 导致 其 不 能 完全 满足 高 性 能 计算 的 需求 ， 而 多 机 虚拟 化 的 研究 
仍 处 于 初级 阶段 ， 虚拟 化 安全 机 制 、 虚 拟 性 能 评测 手段 等 仍 在 进一步 的 研究 和 发 展 之 中 。 


10.2 虚拟 化 的 分 类 


虚拟 化 和 目 提出 以 来 ， 深刻 地 影响 到 计算 机 技术 的 方方面面 ,包括 存储 、 内 存 、 网 络 、 
CPU、 服 务 器 、 操 作 系统 ， 等 等 。 本 节 中 将 分 别 讨论 各 种 虚拟 化 技术 的 应 用 。 


10.2.1 内存 虚拟 化 


内 存 虚 拟 化 是 指 利 用 虚拟 化 技术 实现 计算 机 内 存 系统 对 内 存 的 管理 。 从 上 层 应 用 看 
来 ， 内 存 虚 拟 化 系统 使 得 其 具有 连续 可 用 的 内 存 ， 即 一 个 连续 而 完整 的 地 址 空间 。 从 物 
理 层 来 看 ， 它 通常 被 分 割 成 多 个 物理 内 存 碎 片 。 当 主 存 空 间 不 足 时 ， 它 可 能 还 有 部 分 数 
据 暂 存在 外 部 的 磁盘 存储 器 上 ， 在 需要 时 ， 进 行 必要 的 数据 交换 。 

VMM 虚拟 机 监视 器 (VMM virtual machine monitor) 是 实现 各 种 虚拟 化 的 重要 部 件 。 
内 存 虚 拟 化 需要 对 内 存 和 硬盘 上 的 虚拟 内 存 拥 有 控制 权 ， 方 便 后 续 的 管理 和 控制 。 

然而 内 存 虚 拟 化 也 存在 一 定 的 缺陷 ， 诸 如 大 量 使 用 图 形 处 理 和 内 存 的 应 用 程序 、 多 
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媒体 或 复杂 的 计算 程序 ， 内 存 虚 拟 化 并 不 能 满足 它们 对 计算 和 内 存 资 源 的 消耗 ， 因 此 ， 
内 存 虚拟 化 技术 对 这 些 应 用 而 言 ， 并 没有 带 来 性 能 的 提高 。 相 反 ， 由 于 需要 一 定 的 内 存 
空间 运行 VMM， 反 而 会 导致 一 定 程度 的 性 能 下 降 。 


10.2.2 ”存储 虚拟 化 


存储 虚拟 化 的 主要 思想 就 是 将 资源 的 逻辑 视图 和 物理 存储 分 离 ， 从 而 为 系统 提供 简 
化 无 颖 的 资源 管理 。 | 

从 用 户 的 角度 来 看 ， 虚 拟 化 的 存储 资源 就 是 一 个 巨大 的 “存储 池 ”。 用 户 不 需要 ， 
也 无 法 看 到 具体 的 磁盘 磁带 ， 也 不 需要 关心 自己 数据 的 数据 流 ， 即 数据 由 哪 条 路 径 通 往 
哪个 具体 的 存储 设备 。 

从 管理 的 角度 来 看 ， 虚 拟 存 储 池 和 采取 集中 化 的 管理 ， 并 根据 具体 的 需求 把 存储 资源 
动态 分 配给 各 个 应 用 。 例 如 ， 利 用 虚拟 化 技术 ， 可 以 用 磁盘 阵列 模拟 磁带 库 ， 为 应 用 提 
供 速 度 像 磁盘 一 样 快 ， 容 量 却 像 磁 带 库 一 样 大 的 存储 资源 ， 这 就 是 当今 应 用 越 来 越 广泛 
的 虚拟 磁带 库 (virtual tape library, VTL). 

兼容 性 是 存储 虚拟 化 技术 必须 考虑 的 一 个 问题 。 采 用 的 存储 虚拟 化 技术 如 果 源 自 不 同 
的 厂商 ， 那 么 在 后 续 的 升级 和 更 新 中 ， 如 果 想 替换 原先 的 方案 ， 则 会 增加 系统 更 新 的 难度 。 


10.2.3 网络 虚拟 化 


网 络 虚 拟 化 是 从 软件 抽象 的 角度 ， 从 物理 网 络 元 素 中 分 离 网 络 流量 的 一 种 方式 。 网 
络 虚拟 化 与 其 他 形式 的 虚拟 化 有 很 多 共同 之 处 。 

对 于 网 络 虚 拟 化 来 说 ， 抽 象 隔离 了 网 络 中 的 交换 机 、 网 络 端口 、 路 由 器 以 及 其 他 物 
理 元 素 的 网 络 流量 。 每 个 物理 元 素 被 网 络 元 素 的 虚拟 表示 形式 取代 。 管 理 员 能 够 配置 虚 
拟 网 络 元 素 ， 以 满足 其 独特 的 需求 。 网 络 虚拟 化 在 此 处 的 主要 优势 是 将 多 个 物理 网 络 整 
合 进 更 大 的 逻辑 网 络 中 ， 从 而 更 加 高 效 地 进行 网 络 资源 分 配 ， 提 高 利用 效率 。 

然而 网 络 虚 拟 化 依然 面临 一 些 技术 上 的 问题 。 网 络 设 备 和 服务 器 不 同 ， 它 们 一 般 主 
要 执行 高 IO 任务 ， 对 于 数据 的 处 理 往往 会 依赖 于 专 有 的 硬件 模块 。 例 如 ， 高 速 路 由 、 
数据 包 转 发 、 加 密 (IPsec、SSL)、 负 载 均衡 等 操作 ， 都 会 依赖 于 专用 处 理 器 。 如 果 简 单 
地 将 网 络 设备 重新 定义 为 一 个 虚拟 机 格式 ， 专 用 硬件 就 失效 了 ， 这 些 任务 将 交 由 通用 的 
CPU 执行 。 因 此 ， 有 时 会 导致 性 能 显著 下 降 。 


10.2.4 ”服务 器 虚拟 化 


通过 对 服务 器 资源 视图 的 抽象 ， 可 以 构建 一 个 针对 服务 器 资源 的 逻辑 视图 。 如 此 一 
来 ， 服 务 器 将 不 会 受到 物理 上 的 限制 。 和 存储 虚拟 化 的 思想 类 似 ， 我 们 将 服务 器 提供 的 
CPU. Aff. Mit. VO 等 硬件 形成 可 以 集中 管理 的 资源 池 ， 通 过 集中 式 的 动态 按 需 分 
配 ， 可 以 提高 资源 的 利用 率 ， 简 化 对 复杂 系统 的 管理 ， 同 时 使 服务 器 能 够 穿越 物理 地 域 
的 限制 ， 更 加 动态 灵活 地 让 IT 业务 多 样 化 地 发 展 。 

服务 器 虚拟 化 主要 分 为 以 下 3 种 。 

1: —# 

将 一 台 服 务 器 虚拟 化 为 多 台 服 务 器 ， 使 各 个 服务 器 之 间 相 互 独立 ， 互 不 干扰 ， 为 多 
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个 应 用 同时 提供 服务 ， 增 强 了 单 台 服 务 器 的 多 用 户 处 理 能 力 。 

2. 多 庶 一 

将 多 个 物理 上 独立 的 服务 器 虚拟 化 为 一 个 逻辑 服务 器 ， 使 多 台 服 务 器 协调 工作 ， 处 
理 同 一 个 任务 。 通 过 这 种 手段 ， 能 够 获得 性 能 更 加 强大 的 服务 器 性 能 ， 从 而 削减 成 本 。 
与 此 同时 ， 针 对 服务 器 的 性 能 提升 变 得 更 加 灵活 。 

3 多 应 多 | 

其 建立 在 前 两 者 的 基础 之 上 ， 将 多 台 物 理 服务 器 虚拟 成 一 台 逻 辑 服务 器 ， 然 后 再 将 
其 划分 为 多 个 虚拟 环境 ， 即 多 个 业务 在 多 台 虚 拟 服务 器 上 运行 。 这 既 能 够 提高 服务 器 的 
多 用 户 处 理 能 力 ， 也 能 更 好 地 分 配 资源 。 当 然 ， 这 样 的 服务 器 虚拟 化 方式 实现 起 来 比较 
复杂 。 

服务 器 虚拟 化 存在 一 些 难 以 解决 的 缺点 。 首 先 服务 器 虚拟 化 并 不 适用 于 所 有 场景 。 
针对 一 些 高 端 应 用 , 如 果 这 些 应 用 非常 消耗 计算 资源 , 同时 需要 频繁 地 访问 内 存 和 硬盘 ， 
那么 将 服务 器 运行 在 虚拟 环境 下 可 能 会 导致 性 能 无 法 满足 需求 。 

再 者 ， 虚 拟 化 服务 器 意味 着 对 系统 做 了 巨大 的 修改 ， 一 个 新 的 复杂 的 虚拟 层 被 引入 
了 进来 ， 如 果 虚 拟 服务 器 中 的 一 个 部 件 没有 按 计划 正常 运行 ， 那 么 需要 做 相当 多 的 额外 
工作 寻找 产生 问题 的 根源 ， 这 会 大 大 增加 系统 的 维护 和 管理 开销 。 


10.3 存储 虚拟 化 的 类 型 


本 节 将 介绍 两 种 常用 的 虚拟 化 技术 : 块 级 存储 虚拟 化 和 文件 级 存储 虚拟 化 。 
10.3.1 块 级 存储 虚拟 化 


块 级 存储 虚拟 化 技术 将 块 存储 单元 LUN) 进行 集合 ， 从 而 实现 了 独立 于 具体 的 底 
层 物理 存储 实现 的 虚拟 存储 卷 配给 。 

在 SAN 中 ， 虚 拟 层 会 对 实际 的 物理 存储 设备 做 抽象 化 处 理 ， 形 成 一 个 可 以 容纳 不 
同 存储 设备 的 存储 池 。 虚 拟 卷 可 以 被 创建 、 指 向 存储 池 中 一 定 大 小 的 存储 区 域 并 分 配给 
主机 。 因 此 ， 在 逻辑 上 ， 存 储 数 据 的 地 址 是 指向 虚拟 卷 的 地 址 ， 而 不 是 指 癌 实际 物理 存 
储 设备 的 地 址 。 对 于 主机 与 存储 阵列 ， 虚 拟 层 扮演 了 目标 设备 和 发 起 设备 两 个 角色 。 虚 
拟 层 将 虚拟 卷 与 存储 阵列 中 的 LUN 进行 映射 。 映 射 操 作 是 对 主机 可 见 的 因此 主机 除 
了 直接 访问 虚拟 卷 外 ， 还 可 以 通过 访问 物理 卷 的 方式 访问 虚拟 卷 。 一 般 而 言 ， 虚 拟 层 通 
过 一 个 专门 的 虚拟 化 设备 进行 管理 ， 它 与 主机 以 及 存储 阵列 都 是 连接 的 。 

10-1 为 一 个 虚拟 化 的 环境 。 图 中 的 两 台 物 理 服 务 器 都 被 分 配 了 一 个 虚拟 卷 。 虚 拟 
卷 由 上 层 的 应 用 服务 器 使 用 。 虚 拟 卷 映射 到 存储 阵列 中 的 LUN 上 。 当 有 IO 发 送 到 虚拟 
卷 时 ， 该 IO 会 通过 存储 网 络 中 的 虚拟 层 映 射 到 对 应 的 LUN E. 

块 级 存储 虚拟 化 具有 良好 的 可 扩展 性 ， 有 利于 实现 存储 卷 的 在 线 扩展 ， 从 而 解决 了 
在 应 用 日 益 丰 富 的 今天 ， 应 用 系统 对 于 存储 空间 持续 增长 的 需求 。 

此 外 ， 块 级 存储 虚拟 化 还 支持 对 不 中 断 的 数据 迁移 功能 。 在 传统 的 SAN 环境 中 ， 
主机 需要 更 新 阵列 的 相关 配置 ， 因 此 LUN 从 一 个 阵列 迁移 到 另 一 个 阵列 是 一 项 离线 的 
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操作 。 这 样 ， 在 一 些 情况 下 ，LUN 的 迁移 需要 占用 大 量 的 主机 资源 ， 甚 至 使 主机 停止 服 
务 ， 以 将 数据 从 原先 的 阵列 迁移 到 其 他 的 阵列 中 。 但 是 ,在 使 用 块 级 存储 虚拟 化 技术 后 ， 
后 端 数 据 的 迁移 工作 将 交 给 虚拟 层 来 完成 , 数据 在 迁移 时 , LUN 仍 可 在 线 并 被 用 户 读 写 。 
主机 依然 通过 虚拟 卷 读 写 数据 ， 因 此 无 需 关 注 物理 存储 设备 的 改变 。 

在 过 去 ， 块 级 存储 虚拟 化 技术 只 能 实现 数据 中 心 内 部 的 无 中 断 数 据 迁 移 。 但 是 ， 随 
着 技术 的 进步 ， 新 一 代 的 块 级 存储 虚拟 化 技术 已 经 可 以 实现 在 数据 中 心 之 间 进 行 无 中 断 
数据 迁移 。 在 该 技术 中 ， 多 个 数据 中 心 都 可 以 与 虚拟 层 连 接 。 被 连接 的 虚拟 层 会 得 到 集 
中 的 管理 ， 在 逻辑 上 显示 为 一 个 跨越 多 个 数据 中 心 的 单个 的 虚拟 层 ， 如 图 10-2 所 示 。 这 
样 ， 便 实现 了 存储 设备 内 部 与 存储 设备 之 间 的 块 级 存储 资源 的 整合 。 虚 拟 卷 可 以 在 整合 
后 的 存储 资源 上 存储 。 


| 





图 10-1 块 级 存储 虚 拟 化 图 10-2 块 级 存储 资源 的 联合 


10.3.2 ”文件 级 存储 虚拟 化 


在 NAS 环境 中 ,文件 数据 与 物理 存储 位 置 之 间 的 绝对 对 应 关系 被 文件 级 存储 虚拟 
化 技术 消除 ， 这 使 得 文件 的 存储 方式 更 为 灵活 ， 对 文件 的 操作 更 为 便利 。 文 件 级 虚拟 化 
技术 是 NAS 文件 服务 器 环境 中 很 常见 的 一 种 技术 , 它 实现 了 读 写 中 文件 的 移动 , 提高 了 
存储 设备 的 利用 率 与 运行 效率 。 

在 没有 应 用 文件 级 存储 虚拟 化 技术 的 系统 中 ， 每 台 主机 都 必须 记录 它 所 拥有 的 共享 
文件 存在 于 哪些 共享 存储 设备 上 ， 以 及 文件 在 存储 设备 上 的 准确 位 置 。 这 些 数据 的 结构 
不 仅 开销 巨大 而 且 维护 困难 ， 因 此 这 种 机 制 会 造成 存储 资源 利用 率 较 低 。 此 外 ,在 文件 
服务 器 已 满 的 情况 下 ， 文 件 需要 从 一 台 服 务 器 移动 到 另 一 台 服 务 器 上 ， 在 这 样 的 系统 中 
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移动 文件 十 分 困难 ， 因 为 文件 在 移动 过 程 中 不 能 被 访问 ， 需 要 服务 器 在 较 长 的 一 段 时 间 
内 停止 服务 , 专门 进行 文件 移动 。 此 外 ， 主 机 和 应 用 程序 也 必须 重新 配置 新 的 访问 路 径 。 
文件 级 存储 虚拟 化 技术 极 大 地 简化 了 文件 的 移动 操作 。 它 提供 了 一 种 高 层次 的 抽 
象 ， 并 利用 这 种 抽象 将 文件 与 具体 的 物理 存储 设备 分 离 。 在 文件 级 虚拟 化 技术 中 ， 系 统 
会 创建 一 个 逻辑 上 的 存储 池 ， 这 个 存储 池 可 以 对 下 层 具 体 的 存储 设备 进行 管理 以 及 分 配 
资源 ， 同 时 允许 上 层 的 用 户 使 用 一 个 逻辑 路 径 存 取 文 件 。 文 件 级 虚拟 化 技术 极 大 地 方便 
了 文件 在 不 同 服务 器 或 储存 设备 〈 通 常 是 NAS) 之 间 的 移动 。 例 如 ， 文 件 被 移动 时 , 用 
户 依然 可 以 不 中 断 地 访问 他 们 的 文件 。 此 外 ， 用 户 还 可 以 从 旧 的 位 置 读 取 他 们 的 文 
件 ， 然 后 将 其 写 入 新 的 位 置 ， 在 这 个 过 程 中 ， 文 件 的 物理 位 置 对 于 用 户 是 透明 的 。 
多 个 用 户 可 以 同时 连接 到 多 人 台 服 务 器 执行 在 线 的 文件 转移 ， 从 而 优化 利用 其 资源 。 
使 用 文件 级 虚拟 化 技术 之 前 和 之 后 的 服务 环境 的 对 比如 图 10-3 所 示 。 


虚拟 化 应 用 设备 





Ca) 文件 级 存储 虚拟 化 前 Cb) 文件 级 存储 虚拟 化 后 
图 10-3 文件 级 虚拟 化 环境 实现 前 后 对 比 


10.4 ”存储 虚拟 化 技术 


10.4.1 基于 主机 的 存储 虚拟 化 技术 


基于 主机 的 虚拟 化 也 称 为 基于 服务 器 的 虚拟 化 ， 是 通过 在 服务 器 操作 系统 中 峰 入 或 
添加 虚拟 层 来 实现 设备 虚拟 化 ， 该 方法 不 需要 添加 特殊 的 硬件 ， 而 只 需 安装 具有 虚拟 化 
功能 的 软件 模块 ， 它 以 驱动 程序 的 形式 峰 入 应 用 服务 器 的 操作 系统 中 ， 呈 现 给 操作 系统 
HERH (logic volume)， 通 过 逻辑 卷 把 分 布 在 多 机 上 的 物理 存储 设备 上 映射 成 一 个 统 
一 的 逻辑 虚拟 存储 空间 ， 逻 辑 卷 管理 系统 实际 上 是 一 个 从 物理 存储 设备 映射 到 逻辑 卷 的 
虚拟 化 存储 管理 层 ， 它 可 实现 系统 级 和 应 用 级 的 多 机 间 存 储 共 享 。 

运行 在 服务 器 上 的 虚拟 化 软件 需要 占用 服务 器 的 CUP、 内 存 、 带 宽 等 开销 ， 对 操作 
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系统 的 依赖 性 较 大 ， 这 使 得 虚拟 化 系统 不 能 兼容 不 同 的 平台 ， 移 植 性 较 差 。 

但 是 基于 主机 的 虚拟 化 最 容易 实现 ， 一 般 只 需 在 应 用 服务 器 问安 装 卷 管理 驱动 模 
块 ， 就 可 以 完成 存储 虚拟 化 的 过 程 ， 具 有 成 本 低 、 同 构 平台 下 性 能 高 的 特点 。 

网 络 的 虚拟 存储 化 技术 是 当前 存储 虚拟 化 的 主流 技术 ， 它 当前 在 商业 上 具有 较 多 的 
成 功 产 品 。 典 型 的 网 络 虚拟 存储 技术 主要 包括 网 络 附加 存储 《network attached storage, 
NAS) 和 存储 区 域 网 络 (storage area network，SAN)。 由 于 这 两 种 系统 的 体系 结构 、 通 
fab. 数据 管 理 的 方式 不 同 , 所 以 NAS 主要 应 用 于 以 文件 共享 为 基础 的 虚拟 存储 系统 
中 ，SAN 主要 应 用 在 以 数据 库 应 用 为 主 的 块 级 别 的 数据 共享 领域 。 存 储 区 域 网 络 是 当前 
网 络 存 储 的 主流 技术 。 

虚拟 化 存储 的 实现 可 以 分 布 在 从 主机 到 存储 设备 之 间 路 径 的 不 同位 置 上 ， 由 此 可 把 
基于 网 络 的 存储 虚拟 化 细 分 为 基于 交换 机 的 虚拟 化 、 基 于 路 由 器 的 虚拟 化 和 基于 存储 服 
务 器 端的 虚拟 化 。 

交换 机 的 虚拟 化 是 在 交换 机 中 岁入 固件 化 的 虚拟 化 模块 层 实现 的 ， 由 于 在 交换 机 中 
集成 有 交换 和 虚拟 化 功能 ， 交 换 机 很 容易 成 为 系统 的 瓶 贷 ， 并 可 能 产生 单 点 故障 。 不 过 
这 种 结构 不 需要 在 服务 器 上 安装 虚拟 化 软件 ， 可 以 减少 应 用 服务 器 的 负载 ， 也 没有 基于 
存储 设备 或 者 主机 环境 的 安全 性 问题 ， 在 异 构 环 境 下 有 较 好 的 互 操作 性 。 

路 由 器 的 虚拟 化 是 将 虚拟 化 模块 集成 到 路 由 器 中 ， 使 存储 网 络 的 路 由 器 既 具 有 交换 
机 的 交换 功能 ， 又 具有 路 由 器 的 协议 转换 功能 ， 它 把 存储 虚拟 化 的 范围 由 局 域 网 范围 内 
的 虚拟 存储 扩展 到 了 广 域 虚 拟 存储 。 

近年 来 ， 基 于 路 由 器 的 虚拟 化 技术 得 到 了 长 足 的 发 展 和 广泛 的 应 用 ， 如 基于 iSCSI 
的 虚拟 存储 技术 等 ， 它 为 广域网 下 的 云 存 储 夯 实 了 底层 结构 。 

专用 元 数据 的 虚拟 化 是 在 存储 网 络 中 接 入 一 台 专 用 的 元 数据 服务 器 来 完成 存储 虚 
拟 化 工作 ， 属 于 带 外 虚拟 化 方法 。 

元 数据 服务 器 提供 基于 网 络 虚拟 存储 服务 ， 它 负责 映射 不 同 的 物理 设备 ， 形 成 整个 
虚拟 设备 存储 池 的 全 局 统一 数据 视图 ， 并 负责 与 驻 留 在 各 个 应 用 服务 器 上 的 虚拟 化 代理 
软件 进行 通信 ， 各 应 用 服务 器 上 的 虚拟 代理 软件 负责 管理 存储 访问 视图 和 IO 通信 ， 并 
实现 数据 访问 重 定向 ， 该 代理 软件 具有 数据 高 速 缓存 和 数据 预存 取 ， 以 及 维护 本 地 存储 
视图 和 元 数据 的 功能 ， 可 以 缓存 和 暂 存 本 地 存 取 的 元 数据 信息 ， 并 保持 与 专用 元 数据 服 
务 器 的 数据 一 致 性 ， 通 过 数据 访问 的 局 部 性 减少 访问 元 数据 服务 器 的 次 数 ， 从 而 显著 提 
高 存储 吞吐 率 。 


10.4.2” 块 级 存储 虚拟 化 技术 


在 虚拟 SAN 技术 中 ， 单 一 的 物理 SAN 可 以 被 划分 为 多 个 虚拟 SAN， 在 逻辑 上 ， 每 
个 虚拟 SAN 都 是 一 个 独立 而 完整 的 SAN 设备 , 可 以 执行 独立 的 任务 , 分 配 独 立 的 资源 ， 
且 每 一 个 虚拟 SAN 的 配置 不 会 对 其 他 虚拟 SAN 产生 影响 。 此 外 , 物理 SAN 中 有 关于 每 
个 虚拟 SAN 拓扑 结构 的 定义 ， 通 过 这 样 的 定义 ， 虚 拟 SAN 可 以 实现 彼此 之 间 的 通信 。 

虚拟 SAN 技术 是 块 级 存储 虚拟 化 中 的 一 项 重要 技术 ， 通 过 划分 虚拟 SAN， 促 进 物 
理 SAN 资源 的 合理 分 配 与 有 效 利用 ， 间 接地 提升 了 SAN 设备 的 性 能 。 此 外 ， 不 同 数据 
与 信息 在 不 同 虚拟 SAN 上 可 以 采用 不 同 的 方式 存储 与 访问 ， 提 升 了 数据 的 安全 性 。 
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虚拟 SAN 技术 简便 而 灵活 ， 以 较为 低廉 的 成 本 提供 了 快捷 、 高 效 的 SAN 设备 管理 
方式 。 


10.4.3 ”文件 级 存储 虚拟 化 技术 
文件 存储 虚拟 化 的 实质 是 在 客户 端 计算 机 与 NAS 或 文件 服务 器 间 插 入 一 个 虚拟 层 ， 


由 它 来 建立 客户 端 计算 机 与 NAS 或 文件 服务 器 之 间 的 连接 ， 从 而 解决 大 型 应 用 系统 中 ， 


文件 服务 器 、NAS 与 客户 端 计 算 机 间 的 存储 连接 


关系 过 于 复杂 而 影响 系统 性 能 的 问题 ， 如 图 10-4 
所 示 。 

相 比 SAN 环境 中 的 块 级 存储 虚拟 化 技术 , 在 
文件 级 存储 虚拟 化 中 也 有 类 似 的 虚拟 化 方案 与 应 
用 技术 。 在 传统 的 网 络 文件 传输 或 共享 应 用 中 ， sani 
依靠 文件 服务 器 或 NAS 与 客户 端 计算 机 之 间 , 通 
过 统一 命名 约定 的 路 径 来 识别 并 确认 存储 路 径 ， 
从 而 通过 该 路 径 提 供 的 目录 与 路 径 让 客户 端 计 
算 机 访问 NAS 或 文件 服务 器 上 的 文件 。 但 在 大 
型 应 用 系统 中 , 文件 服务 器 、NAS 与 客户 端 计算 
机 间 的 存储 连接 关系 十 分 复杂 ， 不 仅 不 便于 管 
理 ， 也 不 易于 改变 连接 结构 或 更 新 设备 ,一旦 设 
备 变动 ， 就 会 同时 牵涉 到 许多 存储 路 径 的 修改 ， 
可 扩展 性 差 。 10-4 文件 级 虚拟 化 技术 

因此 一 种 解决 方式 就 是 舍弃 过 去 的 基于 路 径 的 存储 方法 ， 在 客户 端 计算 机 与 NAS 
或 文件 服务 器 间 插 入 一 个 虚拟 层 , 由 它 来 建立 客户 端 计算 机 与 NAS 或 文件 服务 器 之 间 的 
连接 。NAS 上 的 空间 也 不 是 通过 实际 的 位 置 来 表示 的 ， 而 是 通过 虚拟 层 的 “全 局 命名 空 
间 ” 提 供 的 虚拟 位 置 来 表示 。 

在 全 局 命名 空间 的 架构 下 ， 可 以 摆脱 对 存储 路 径 的 依赖 ， 所 有 文件 存储 资源 都 被 虚 
拟 层 整合 为 统一 的 存储 池 ， 因 此 用 户 存 储 文件 的 “逻辑 ”名 称 或 位 置 与 “实际 ”名 称 或 
位 置 之 间 没有 必然 的 关系 ， 用 户 发 起 的 访问 请 求 会 被 虚拟 层 导向 到 设 定 的 位 置 ， 而 不 需 
要 知道 文件 的 实际 位 置 。 这 样 的 访问 方式 与 网 络 中 用 户 不 需要 知道 实际 的 了 P, 甚至 MAC 
地 址 ， 只 需 通过 DNS 的 转换 ， 便 能 自动 连接 到 正确 的 Web 服务 器 的 访问 方式 类 似 。 即 
使 某 一 存储 路 径 失效 ， 也 能 够 通过 虚拟 层 自动 转移 到 另 一 存储 路 径 上 ， 因 此 文件 存储 服 
务 的 可 靠 性 有 了 一 定 程度 的 提高 。 

由 于 不 会 受 限 于 实际 的 连接 ， 系 统管 理 者 可 轻易 地 在 不 同 的 NAS 或 文件 服务 器 内 
部 或 者 之 间 迁 移 数据 ， 而 无 须 担心 前 端 用 户 原来 的 存储 数据 会 因此 而 受到 影响 ， 极 大 地 
降低 了 数据 迁移 的 难度 与 其 消耗 的 资源 ， 而 且 管 理 者 还 能 制定 策略 ， 让 虚拟 层 根据 文件 
的 属性 或 时 间 ， 自 动 将 文件 迁移 到 不 同等 级 的 存储 设备 上 ， 实 现 数据 归档 或 分 级 存储 。 

实际 的 作法 通常 是 在 网 络 上 放置 带 有 全 局 命名 空间 功能 软件 的 应 用 服务 器 ， 这 人 台 应 
用 服务 器 的 作用 就 像 网 络 上 的 DNS 服务 器 一 样 ， 会 遍历 所 有 的 NAS 与 文件 服务 器 上 的 
实际 存储 路 径 ， 转 为 全 局 命名 空间 后 ， 再 反馈 到 前 端的 客户 端 计算 机 。 后 端 存储 设备 若 
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有 任何 变动 ， 只 需 在 应 用 服务 器 更 改 存储 设 定 即 可 ， 因 而 不 会 影响 到 前 端的 客户 端 计 
算 机 。 


10.5 云 存 储 虚 拟 化 技术 


10.5.1 云 存储 虚拟 化 的 定义 


云 存储 虚拟 化 是 指 通过 集群 应 用 、 网 格 技术 或 分 布 式 文件 系统 等 功能 ， 将 网 络 中 大 
量 不 同类 型 的 存储 设备 通过 应 用 软件 集合 起 来 协同 工作 ， 共 同 对 外 提供 数据 存储 和 业务 
访问 功能 的 一 个 系统 。 当 云 计算 系统 运算 和 处 理 的 核心 是 大 量 数据 的 存储 和 管理 时 ， 云 
计算 系统 中 就 需要 配置 大 量 的 存储 设备 ， 云 计算 系统 就 转变 为 一 个 云 存 储 系统 ， 因 此 云 
存储 是 一 个 以 数据 存储 和 管理 为 核心 的 云 计算 系统 。 简 单 来 说 ， 云 存储 就 是 将 储存 资源 
放 到 云 上 供 人 存 取 的 一 种 新 兴 方 案 。 用 户 可 以 在 任何 时 间 、 任 何 地 点 ， 透 过 任何 可 联网 
的 装置 连接 到 云 上 方便 地 存 取 数 据 。 


10.5.2 ” 云 存 储 虚 拟 化 模型 


根据 云 存 储 系统 的 结构 和 特点 ， 可 以 将 云 存储 虚拟 化 模型 分 为 3 个 部 分 。 

l. 物理 设备 虚拟 化 层 

利用 底层 物理 设备 创建 一 个 存储 池 ， 即 连续 的 逻辑 地 址 空间 ， 主 要 用 来 管理 数据 块 
级 别 和 分 配 资源 ， 同 时 ， 根 据 用 户 的 需求 和 物理 设备 的 属性 ， 存 储 池 可 以 存在 多 个 不 同 
的 数据 属性 ， 如 性 能 权重 、 可 靠 性 等 级 和 读 写 特征 。 存 储 设 备 可 以 管理 数据 块 的 映射 和 
转发 ， 并 在 存储 池 中 分 配 逻 辑 卷 和 动态 分 配 存 储 资源 。 

2. 存储 节点 虚拟 化 层 

这 一 部 分 可 以 实现 存储 节点 内 部 多 个 存储 池 之 间 的 资源 分 配 和 管理 。 它 可 以 将 一 个 
或 多 个 存储 池 整 合 为 一 个 在 存储 节点 范围 内 统一 的 虚拟 存储 池 。 这 个 虚拟 化 层 的 实现 方 
式 由 存储 节点 虚拟 模块 在 存储 节点 内 部 实现 ， 对 下 管理 存储 设备 ， 对 上 支持 接 下 来 要 提 
到 的 存储 区 域 网 络 虚 拟 化 层 。 

3. 存储 区 域 网 络 虚 拟 化 层 

这 一 层 可 以 完成 存储 节点 之 间 的 资源 分 配 以 及 管理 的 任务 。 它 可 以 集中 管理 所 有 存 
储 设备 上 的 存储 池 来 组 成 一 个 统一 的 虚拟 存储 池 。 这 个 虚拟 化 层 是 由 虚拟 存储 管理 模块 
在 虚拟 存储 管理 服务 器 上 实现 的 ， 为 虚拟 磁盘 管理 提供 地 址 映射 和 查询 等 服务 。 

这 三 层 虚 拟 化 存储 模型 大 大 降低 了 存储 管理 的 复杂 度 ， 有 效 地 封装 了 底层 存储 设备 
的 复杂 性 和 多 样 性 。 这 样 的 方法 使 系统 具备 了 更 加 良好 的 扩展 性 和 灵活 性 。 用 户 可 以 将 
存储 设备 添加 到 存储 池 中 ， 在 进行 简单 配置 后 ， 便 可 以 创建 虚拟 卷 。 这 使 得 用 户 不 必 关 
注 系统 中 单个 设备 的 物理 存储 容量 和 存储 介质 的 属性 ， 就 可 以 实现 统一 的 存储 管理 。 


10.5.3 ” 云 存 储 虚 拟 化 的 系统 构成 
分 布 式 存 储 是 云 虚拟 存储 中 的 一 个 典型 方式 。 这 种 方式 利用 IP 网 络 管理 元 数据 
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和 传输 数据 ， 采 用 带 外 虚拟 化 的 方式 管理 存储 设备 。 这 一 类 型 的 存储 系统 有 4 类 存储 
设备 。 

L. 客户 端 

顾名思义 ， 客 户 端 可 以 为 用 户 提供 各 种 各 样 的 应 用 服务 ， 如 我 们 熟知 的 数据 库 、 文 
件 服务 、 万 维 网 服务 、 科 学 计算 服务 ， 等 等 。 客 户 端 将 会 运行 存储 代理 软件 ， 以 提供 网 
络 虚 拟 设备 供应 用 程序 读 写 和 访问 。 

2. 配置 管理 服务 器 

配置 管理 服务 器 是 用 来 配置 和 管理 系统 的 设施 。 它 通过 Internet. telnet 或 者 其 他 接 
口 登 录 云 存储 平台 ， 以 远程 的 方式 配置 和 管理 整个 存储 系统 。 

3. 元 数据 服务 器 

在 云 存储 系统 中 ， 元 数据 服务 器 (MDS) 管理 整个 系统 的 元 数据 和 对 和 象 数 据 的 布局 
fA, 它 主 要 负责 系统 的 资源 分 配 和 网 络 虚 拟 磁盘 的 地 址 映射 。 MDS 通过 见 余 管理 软件 
来 实现 普通 存储 节点 之 间 的 数据 见 余 关 系 ， 同 时 ， 在 MDS 上 部 署 的 全 局 虚拟 化 存储 管 
理 软件 和 集群 管理 软件 可 以 管理 整个 存储 系统 的 配置 和 运行 。 

4. 对 象 存储 节点 

每 个 对 象 存储 节点 都 是 独立 的 存储 设备 ， 负 责 对 象 数据 的 存储 、 和 备份、 迁移 和 恢复 ， 
并 负责 监控 其 他 存储 设备 的 运行 状况 和 资源 情况 。 还 有 一 点 需要 明确 的 是 ， 存 储 节 氮 上 
运行 着 虚拟 化 存储 管理 软件 并 存储 了 应 用 程序 所 需 的 数据 。 


10.5.4 ”存储 虚拟 化 的 优点 


存储 虚拟 化 是 实现 云 存储 平台 的 一 项 基本 技术 ， 有 着 不 可 或 缺 的 技术 地 位 。 下 面 介 
绍 存储 虚拟 化 能 在 哪些 方面 为 云 存储 平台 提供 高 效 的 服务 。 

1. 大 幅度 增加 硬件 资源 的 使 用 效率 

现在 每 年 我 们 都 会 在 设备 淘汰 和 更 新 换代 中 浪费 大 量 的 硬件 设施 ， 同 时 ， 新 设备 的 
采购 成 本 又 成 为 困扰 用 户 的 一 个 大 问题 。 存 储 虚 拟 化 可 以 有 效 解 决 这 个 问题 。 存 储 虚 拟 
化 技术 充分 实现 了 存储 资源 的 异 构 整 合 ， 具 体 来 说 就 是 存储 虚拟 化 将 整合 异 构 平 台 ， 加 
强 原 有 设备 利用 率 ， 解 决 数据 容量 增长 扩充 ， 降 低 硬 件 升级 成 本 。 这 些 优势 成 为 现在 存 
储 虚 拟 化 技术 被 广泛 青睐 的 原因 。 此 外 ， 存 储 虚 拟 化 还 能 实现 存储 资源 按 需 分 配 ， 这 样 
既 合理 利用 了 存储 空间 ， 又 极 大 提高 了 各 种 硬件 系统 资源 的 使 用 效率 。 

2. 简化 系统 管理 的 复杂 度 

云 存 储 平台 可 以 通过 存储 虚拟 化 技术 ， 使 整个 系统 平台 变 得 更 加 集中 、 更 加 简单 ， 
减少 管理 人 员 的 工作 负担 ， 也 节约 了 成 本 。 同 时 ， 服 务 器 和 存储 网 络 的 自动 化 操作 减少 
了 大 量 潜在 的 人 为 错误 ， 从 更 大 程度 上 保障 了 系统 的 可 靠 性 。 设 备 集中 化 和 标准 化 可 以 
减少 一 些 不 必要 的 麻烦 ， 也 改变 了 客户 的 实际 运行 环境 。 

3. 大 幅度 增强 存储 平台 的 可 靠 性 

存储 的 虚拟 化 其 实 不 仅仅 提供 硬件 资源 的 集中 管理 ， 还 提供 了 各 种 各 样 的 数据 保护 
功能 。 此 外 ， 在 实际 操作 过 程 中 ， 运 用 存储 虚拟 化 技术 可 以 允许 故障 设备 在 线 更 换 来 保 
障 数 据 的 不 间断 读 取 。 

传统 数据 集中 管理 的 一 大 问题 是 容易 造成 设备 IO 负载 过 重 ， 并 且 存 在 单 点 故障 的 
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危险 ; 但 在 云 存 储 平台 下 ,可 以 通过 虚拟 化 技术 实现 IO 负载 均衡 ， 从 而 提高 存储 效率 ， 
降低 单个 设备 性 能 的 局 限 性 。 


10.6 ”华为 存储 虚拟 化 产品 与 应 用 


虚拟 化 技术 已 经 在 存储 领域 得 到 广泛 的 应 用 。 

各 个 存储 设备 厂商 纷纷 推出 了 自己 的 虚拟 化 存储 产品 。 令 人 瞩目 的 是 ， 华 为 提供 了 
企业 级 虚拟 化 存储 服务 ， 推 出 了 针对 云 计算 的 虚拟 机 和 网 络 存储 服务 器 的 虚拟 机 ， 以 及 
VTL 虚拟 带 库 和 VIS 产品 。 同 时 ， 华 为 在 云 存储 系统 中 也 大 量 应 用 了 虚拟 化 技术 ， 实 现 
了 元 数据 服务 器 的 虚拟 化 VMDS， 对 象 存储 服务 器 的 虚拟 化 VOSN， 以 及 数据 容器 的 虚 
拟 化 ， 等 等 。 

虚拟 化 存储 在 各 种 行业 中 已 经 开始 了 大 规模 应 用 。 这 些 应 用 包括 : 

数据 中 心 : 应 用 虚拟 化 技术 提供 计算 和 存储 服务 中 心 、 网 络 管理 中 心 、 灾 难 恢 复 中 
心 、IT 资源 租赁 中 心 等 服务 。 

电信 行业 : 随 着 产业 的 发 展 ， 电 信行 业 面临 两 方面 的 挑战 ， 一 方面 降低 IT 架构 的 成 
本 ， 另 一 方面 提高 IT 架构 的 可 用 性 。 虚 拟 化 技术 正 是 解决 这 一 问题 有 效 办 法 。 

银行 证 券 保险 行业 : 利用 虚拟 化 进行 容 灾 ,采取 “两 地 三 中 心 ” 方 案 ， 即 生产 中 心 、 
同城 灾 备 中 心 、 异 地 灾 备 中 心 。 同 城 灾 备 中 心 负责 一 般 性 灾难 的 防范 ， 异 地 灾 备 中 心 用 
来 防范 大 范围 的 灾难 。 利 用 虚拟 化 技术 ， 可 以 在 统一 的 虚拟 化 基础 架构 中 ， 实 现 跨 数据 
中 心 的 虚拟 化 管理 。 

政府 信息 系统 : 政府 数据 存储 系统 的 建设 正 受到 前 所 未 有 的 重视 。 系 统 利用 先进 的 
存储 虚拟 化 技术 ， 建 立 统一 、 标 准 、 共 享 的 数据 资源 存储 平台 ， 能 够 有 效 地 管理 庞大 、 
繁多 、 复 杂 的 数据 及 相关 的 设备 ， 提 高 资源 利用 率 ， 并 建立 起 全 面 的 数据 安全 保障 体系 。 

为 了 满足 云 计 算数 据 中 心 存储 基础 设施 需求 ， 华 为 公司 推出 了 FusionStorage 一 一 
一 种 分 布 式 块 存储 软件 ， 该 软件 可 以 将 通用 X86 服务 器 的 本 地 HDD. SSD 等 介质 通过 分 
布 式 技 术 组 织 成 一 个 大 规模 存储 资源 池 ， 对 上层 的 应 用 和 虚拟 机 提供 工业 界 标准 的 SCSI 
和 iSCSI 接口 , 类 似 一 个 虚拟 的 分 布 式 SAN 存储 。FusionStorage 软件 架构 如 图 10-5 所 示 。 
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FusionStorage 的 主要 应 用 场景 分 为 两 大 类 : 

一 类 是 在 大 规模 云 计算 数据 中 心中 ,将 通用 X86 存储 服务 器 池 化 ， 建 立 大 规模 块 存 
储 资 源 池 ， 提 供 标准 的 块 存储 数据 访问 接口 (SCSI 和 iSCSI 等 )。 支 持 各 种 虚拟 化 
Hypervisor 平台 和 各 种 业务 应 用 (如 SQL. Web. 行业 应 用 等 ); 可 以 和 各 种 云 平 台 集 成 ， 
如 华为 FusionSphere、VMware、 开 源 Openstack 等 ， 按 需 分 配 存储 资源 。 

另 一 类 是 在 企业 关键 IT 基础 设施 中 ， 通 过 Infiniband 进行 服务 器 互联 以 及 SSD 做 
cache 或 主 存 等 关键 技术 ， 将 存储 系统 的 性 能 和 可 靠 性 得 到 极 大 的 提高 。 又 保留 了 分 布 
式 存 储 的 高 扩展 性 基因 ， 从 而 支持 企业 关键 数据 库 、 关 键 ERP/CRM 等 应 用 的 使 用 ， 解 
决 这 些 关 键 应 用 的 大 数据 量 需 求 。 


10.7 本 章 总 结 


本 章 主要 介绍 了 虚拟 化 的 概念 、 发 展 历程 、 前 景 和 趋势 ， 并 对 虚拟 化 技术 做 了 简单 
的 分 类 。 之 后 详细 、 系 统 地 介绍 了 存储 虚拟 化 中 的 块 级 虚拟 化 、 文 件 级 虚拟 化 技术 ， 最 
后 简单 介绍 云 存储 虚拟 化 技术 。 


10.8 Am 


一 、 选 择 题 
1. 存储 虚拟 化 可 以 分 为 哪 几 类 ? ( ) 

A. 页 面 级 虚拟 化 B. 块 级 虚拟 化 OC. 文件 级 虚拟 化 D. 对 象 级 虚拟 化 
答案 (BC) 
2. 下 列 不 属于 虚拟 化 技术 的 是 《 Je 

A. 内 存 虚拟 化 B. 存储 虚拟 化 c. 网 络 虚拟 化 D. 访问 虚拟 化 
答案 (D) 
3. 云 存储 虚拟 化 模型 可 分 为 《〈 ys 


A. 访问 接口 虚拟 层 B. 物理 设备 虚拟 化 层 

C. 存储 节点 虚拟 化 层 D. 存储 区 域 网 络 虚拟 化 层 
答案 (BCD) 
二 、 简 答题 


1. 早期 的 虚拟 化 技术 和 更 加 高 级 的 虚拟 化 技术 的 显著 区 别 是 什么 ? 请 简单 说 明 这 
种 区 别 带 来 的 改变 。 

2. 存储 虚拟 化 包含 哪 几 种 主要 类 型 ? 简 述 它们 的 主要 特点 以 及 相互 之 间 的 区 别 。 

3. 虚拟 存储 包含 哪些 主要 组 成 部 分 ? 各 个 部 分 的 主要 任务 是 什么 ? 

4. 存储 虚拟 化 给 存储 带 来 了 哪些 便利 和 优点 ? 同 优点 相对 ， 请 简单 分 析 存 储 虚 拟 
化 潜在 的 缺陷 。 
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关于 本 章 


随 着 计算 机 技术 在 商业 系统 中 的 普及 以 及 大 量 应 用 系统 的 上 线 ， 企 业 信息 安全 的 重要 性 
日 益 凸 显 。 但 作为 信息 安全 的 一 个 重要 内 容 ， 数 据 备 份 的 重要 性 却 往往 被 忽视 。 任 何 数 据 交 
换 、 传 输 和 存储 都 有 可 能 产生 数据 故障 ， 自 然 灾害 和 人 为 错误 也 在 威胁 着 信息 安全 。 这 些 情 
况 都 可 能 造成 数据 丢失 、 被 自 改 ， 其 至 使 系统 瘫痪 ， 系 统管 理 员 必须 维护 数据 的 完整 性 和 准 
确 性 ， 以 保证 系统 和 业务 的 持续 运行 。 

要 成 功 备份 恢复 系统 ， 需 要 对 各 种 备份 方法 进行 评估 并 选择 出 合适 的 备份 方案 。 本 章 将 
详细 介绍 备份 的 基础 概念 、 备 份 的 拓扑 结构 、 策 略 的 制定 、 技 术 分 类 及 备份 方案 优化 技术 ， 
以 及 备份 系统 在 华为 产品 中 的 实现 与 应 用 。 
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11.1 备份 基础 


11.1.1 ”数据 备份 概述 


在 信息 系统 中 ， 和 备份 (backup) 是 指 为 原始 数据 制作 一 个 或 者 多 个 额外 的 拷贝 ， 并 
将 其 存放 于 特定 的 设备 上 上， 以便 在 原始 数据 受到 破坏 或 因 其 他 原因 丢失 后 ， 获 取 拷 贝 数 
据 重 新 加 以 利用 。 数 据 备份 的 根本 目的 在 于 数据 的 重新 利用 。 这 也 就 是 说 ， 备 份 工作 的 
核心 是 备份 恢复 ,一 个 无 法 恢复 的 备份 ， 对 于 任何 系统 来 说 都 是 毫 无 意义 的 。 能 够 安全 、 
方便 、 高 效 地 恢复 数据 才 是 备份 系统 的 真正 意义 。 对 于 一 个 完整 的 IT 系统 而 言 ， 备份 工 
作 是 其 中 必 不 可 少 的 组 成 部 分 ， 其 意义 不 仅 在 于 防范 意外 事件 的 破坏 ， 也 是 归档 保存 历 
史 数 据 的 最 佳 方 式 。 

为 了 节省 存储 备份 数据 的 空间 ， 重 复数 据 删除 技术 与 数据 压缩 被 广泛 应 用 于 备份 环 
境 中 。 重 复数 据 删除 技术 采用 软件 或 硬件 的 方式 ， 对 存储 数据 进行 处 理 ， 以 消除 其 中 的 
重复 数据 ， 从 而 减 小 数据 占用 的 存储 空间 。 数 据 压缩 旨 在 降低 备份 数据 的 大 小 ， 使 之 占 
用 更 少 的 存储 空间 ， 这 种 方法 在 磁带 存储 中 尤为 常见 。 重 复数 据 删除 技术 将 在 11.4 节 中 
详细 介绍 。 数 据 备 份 有 以 下 6 个 原则 。 

(1) 稳定 性 : 因为 备份 产品 的 主要 作用 是 为 系统 提供 一 个 数据 保护 的 方法 ， 所 以 备 
份 系统 的 稳定 性 和 可 靠 性 就 是 非常 最 重要 的 一 个 因素 。 备 份 软件 通常 要 求 要 与 操作 系统 
100% 兼 容 ， 并 且 ， 当 事故 发 生 时 能 够 快速 有 效 地 恢复 数据 。 

(2) 全 面 性 : 在 复杂 的 应 用 环境 中 ， 应 用 系统 可 能 采用 了 多 种 操作 平台 ， 包 括 
UNIX, Windows, Linux 等 ， 并 安装 了 各 种 应 用 系统 ， 如 ERP、 数据库、 集群 系统 等 。 
而 备份 系统 要 求 能 够 文 持 各 种 操作 系统 、 数 据 库 和 典型 应 用 ， 以 满足 复杂 的 实际 应 用 
需求 。 

(3) BJE: 很 多 系统 由 于 工作 性 质 ， 对 何 时 备份 、 用 多 长 时 间 备 份 都 有 一 定 的 限 
制 。 在 非 工作 时 间 系 统 负 荷 较 轻 ， 适 于 备份 。 因 此 ， 备 份 方案 应 能 提供 定时 的 自动 备份 ， 
并 利用 目 动 磁带 库 等 技术 自动 更 换 磁 带 。 在 自动 备份 过 程 中 ， 还 要 有 日 志 记 录 功 能 ， 并 
在 出 现 异 常情 况 时 自动 报警 。 

(4) BIERE: 随 着 业务 的 不 断 发 展 ， 数 据 越 来 越 多 ， 更 新 越 来 越 快 ， 在 休息 时 间 来 
不 及 备份 如 此 多 的 内 容 ， 因 此 需要 考虑 提高 数据 备份 的 速度 ， 利 用 多 种 技术 加 快 对 数据 
的 备份 ， 充 分 利用 通道 的 带宽 和 性 能 。 

(5) 操作 简单 : 数据 备份 应 用 于 不 同 领域 ， 进 行 数据 备份 的 操作 管理 人 员 也 处 于 不 
同 的 层次 。 这 就 需要 一 个 直观 的 、 操 作 简 单 的 ， 在 任何 操作 系统 平台 下 都 统一 的 图 形 化 
用 户 界 面 ， 缩 短 操作 人 员 的 学 习 时 间 ， 减 轻 操作 人 员 的 工作 压力 ， 使 备份 工作 得 以 轻松 
地 设置 和 完成 。 

(6) 容 灾 考 虑 : 将 本 地 的 数据 远程 复制 一 份 ， 存 放 在 远离 数据 中 心 的 地 方 ， 以 防 数 
据 中 心 发 生 不 可 预测 的 灾难 。 
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11.1.2 ”备份 系统 架构 


备份 系统 通常 由 驻 留 在 应 用 服务 器 上 的 备份 客户 端 、 安 装 在 备份 服务 器 上 的 备份 软 
件 、 备 份 服务 器 以 及 用 于 保存 备份 数据 的 备份 存储 单元 构成 ， 如 图 11-1 所 示 。 


OO TY CN 
i A A SB 
arid 





存储 阵列 


图 11-1 备份 系统 的 组 成 结构 


1. 备份 客户 端 

任何 需要 备份 数据 的 计算 机 都 称 为 备份 客户 端 ， 通 常 是 指 应 用 程序 、 数 据 库 或 文件 
服务 器 。 备 份 客户 端 也 用 来 表示 能 从 在 线 存储 器 上 读 取 数据 并 将 数据 传送 到 备份 服务 器 
的 软件 组 件 。 

2. 备份 服务 器 

将 数据 复制 到 备份 介质 并 保存 历史 备份 信息 的 计算 机 系统 称 为 备份 服务 器 。 备 份 服 
务 器 通常 分 成 两 类 : 

(1) 主 备份 服务 器 ; 用 于 安排 备份 和 恢复 工作 ， 并 维护 数据 的 存放 介质 。 

(2) 介质 服务 器 : 按照 主 备份 服务 器 的 指令 将 数据 复制 到 备份 介质 上 。 备 份 存储 单 
元 与 介质 服务 器 相连 。 

3. 备份 软件 

备份 软件 是 备份 系统 的 核心 ， 备 份 软件 控制 生产 数据 拷贝 到 存储 介质 上 ， 并 对 备份 
数据 进行 管理 。 

现在 业界 常用 的 备份 软件 有 美国 commVault 公司 的 simpana 软件 平台 以 及 Symmantec 
公司 的 NetbackUP (简称 NBU)。simpana 采用 了 一 种 全 新 的 体系 结构 ， 专 为 操作 简单 、 
无 缝 连接 和 可 伸缩 性 的 存储 方案 而 设计 ， 以 应 对 21 世纪 数据 存储 和 管理 需求 。Netback 
实现 了 利用 一 个 平台 、 一 个 控制 台 兼 顾 物 理 和 虚拟 数据 保护 ， 并 且 统 一 对 快照 、 复 制 的 
快照 、 备 份 以 及 恢复 进行 全 局 管理 。 

4. 备份 存储 单元 

通常 由 介质 服务 器 控制 和 管理 ， 现 在 普遍 使 用 的 存储 单元 有 磁盘 阵列 、 物 理 磁带 库 
和 虚拟 带 库 。 
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11.1.3 ”备份 拓扑 结构 


根据 节点 之 间 的 备份 网 络 类 型 的 不 同 ， 备 份 系统 可 以 分 为 3 种 网 络 拓扑 结构 : 本 地 
服务 器 备份 (host-based)、 基于 局 域 网 备份 (LAN-based)、 基于 SAN 备份 (包括 LAN-Free 
和 Server-Free)。 

1. 基于 本 地 服务 器 备份 

在 本 地 服务 器 备份 配置 中 ， 每 个 备份 服务 器 通过 SCSI 总 线 连接 到 上 自己 的 备份 设备 。 
这 种 情况 下 不 会 占用 局 域 网 CLAN) 带宽 ， 但 工作 人 员 必 须 在 本 地 服务 器 上 手动 管理 存 
储 媒 体 。 

2. 基于 局 域 网 备份 

在 基于 局 域 网 备份 配置 中 ， 客 户 端 、 备 份 服务 器 、 备 份 节点 和 备份 设备 都 通过 局 域 
网 连接 。 数 据 流 和 控制 流 都 基于 LAN 传输 ， 占 用 网 络 资源 的 备份 模式 。 

备份 服务 器 通过 LAN 发 控制 流 到 安装 了 代理 的 应 用 服务 器 上 ， 应 用 服务 器 啊 应 请 
求 通 过 LAN 发 送 数据 到 备份 服务 器 ， 备 份 服务 器 接收 数据 并 存储 到 存储 设备 上 ， 完 成 
备份 如 图 11-2 所 示 。 


e LAN-BASED 


备份 服务 器 
介质 服务 器 





文件 服务 器 应 用 服务 器 


数据 流 “一 一 一 一 = 
指令 流 





数据 备份 存储 设备 
图 11-2 基于 局 域 网 的 备份 拓扑 


3. 基于 SAN 备份 

(1) LAN-PREE 

LAN-Free 也 称 为 无 局 域 网 备份 。 顾 名 思 义 这 种 备份 结构 不 占用 LAN 资源 ， 控 制 流 
基于 LAN 传输 ， 数 据 流 不 经 过 LAN。 在 这 种 连接 方式 下 ， 备 份 设备 和 客户 端 都 连接 到 
SAN 网 络 ， 常 应 用 于 多 个 客户 端 共享 一 个 存储 设备 的 情况 。 

备份 服务 器 通过 LAN 发 送 控制 流 到 文件 服务 器 ， 文 件 服务 器 响应 请 求 读 取 生产 数 
据 ， 通 过 SAN 传输 到 备份 介质 上 ， 完 成 备份 如 图 11-3 所 示 。 

(2) SERVER-FREE 

LAN-Free 备份 需要 占用 文件 服务 器 的 CPU 资源 , 如 果 备 份 过 程 能 够 在 SAN 内 部 完 
成 ， 而 大 量 数据 流 无 需 流 过 服务 器 ， 则 可 以 极 大 降低 备份 操作 对 生产 系统 的 影响 。SAN 
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Server-Free 备份 就 是 这 样 的 技术 ， 文 件 服务 器 只 需要 发 出 SCSI 复制 命令 ， 数 据 就 会 通 
过 SAN 直接 在 多 个 存储 设备 之 间 ， 直 接 进 行 数 据 备份 。 数 据 备 份 不 需要 服务 器 参与 ， 而 


是 由 存储 解决 方案 处 理 ， 如 图 11-4 所 示 。 其 与 传统 备份 方案 相 比 ， 最 大 的 优势 在 于 不 需 
要 占用 服务 器 的 资源 。 四 种 拓扑 连接 方式 的 优 缺 点 见 表 11-1。 
(1) LAN-FREE 


— LAN 







备份 服务 器 
。 介质 服务 器 


(2) LAN-FREE 





图 11-4 Server-Free 的 备份 拓扑 





表 11-1 四 种 拓扑 连接 方式 的 优 缺 点 


不 占用 网 络 资源 | ”需要 手动 管理 存储 媒体 
ST PERS RED 备份 和 恢复 速度 快 备份 费用 高 昌 
存储 设备 不 需要 连接 到 服务 器 ， | ”备份 流量 影响 网 络 性 能 
基于 局 域 网 备份 伸缩 性 好 数据 集 影响 服务 器 性 能 
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(BER) 





服务 器 负载 低 
iii ai 优化 了 数据 传输 效率 






SAN 布置 的 费用 高 昂 
设备 必须 与 SAN 兼容 







es 
备份 服务 器 负载 最 低 BAN ENNA 
Server-Free 备份 大 大 优化 数据 传输 效率 设备 必须 与 SAN 兼容 
需要 第 三 方 设备 支持 


11.1.4 ”常见 的 备份 介质 


1. 磁带 

磁带 为 各 种 场合 的 需要 提供 了 兼顾 容量 和 性 能 的 出 色 数 据 备 份 。 磁 带 低廉 的 价格 使 
它 成 为 较 经 济 的 方式 。 磁 带 介质 可 以 存储 每 日 、 每 周 和 每 月 的 安全 离线 数据 ， 以 及 受 损 
恢复 备份 文件 的 离 站 数据 。 

2， 虚 拟 磁 带 库 

虚拟 磁带 库 (virtual tape library, VTL) 通常 为 一 种 专用 的 计算 工具 (appliance) ， 
它 可 以 仿真 物理 磁带 库 的 驱动 器 并 且 在 磁盘 上 存储 备份 映像 。VTL 由 3 部 分 组 件 构成 : 
计算 机 硬件 、 应 用 软件 〈 用 于 仿真 磁带 库 和 磁带 驱动 器 ) 和 一 组 基于 RAD 技术 的 磁盘 
驱动 器 。VTL 人 允许 客户 配置 虚拟 磁带 驱动 器 、 虚 拟 磁 带 盒 和 指定 磁带 盒 容 量 。 

3. 设备 间 直 接 通信 

设备 间 直 接 通信 (device to device, D2D) 把 磁盘 直接 作为 备份 介质 来 使 用 ， 本 质 是 
就 是 写 文 件 系统 ， 但 并 不 是 用 原文 件 的 格式 和 普通 的 写 方法 ， 把 备份 文件 以 大 块 为 单位 
放 在 一 个 大 文件 中 。 

不 同 存储 介质 的 优 缺 点 如 表 11-2 所 示 。 


表 11-2 不 同类 型 存储 介质 的 优 缺 点 


成 本 低 速度 读 写 速度 慢 
可 扩展 性 强 磁带 不 易 保 存 
VIL 系统 加 快 了 读 写 速 度 仿照 磁带 顺序 读 写 ， 


磁盘 利用 率 低 


充分 利用 磁盘 随机 读 写 功能 ， 磁 盘 利用 率 高 
磁盘 系统 使 用 多 线程 技术 ， 适 用 于 多 备份 任务 的 情况 D2D 没有 统一 的 标准 
功能 多 样 、 管 理 简 单 


11.2 备份 策略 制定 


备份 策略 是 指 确定 需 备 份 的 内 容 、 备 份 周 期 、 备 份 保留 周期 、 备 份 窗口 及 备份 方式 。 
不 同 用 户 要 根据 目 己 的 实际 情况 以 及 备份 需求 制定 不 同 的 备份 策略 。 
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(1) 备份 内 容 : 每 次 备份 操作 所 处 理 的 数据 内 容 ， 可 以 是 全 部 数据 的 备份 ， 也 可 以 
是 部 分 数据 的 备份 。 

(2) 备份 周期 : 两 次 备份 操作 之 间 的 时 间 间 隔 。 

(3) 备份 保留 周期 : 备份 的 数据 在 存储 系统 中 保留 的 时 间 长 度 。 

(4) 备份 窗口 (backup window): 在 用 户 正常 使 用 的 业务 系统 不 受 影 响 的 情况 下 ， 
能 够 对 业务 系统 中 的 业务 数据 进行 备份 的 时 间 间 隔 ， 或 者 说 是 用 于 备份 的 时 间 段 。 备 份 
窗口 可 以 根据 操作 特性 设 定 。 

(5) 备份 方式 : 根据 数据 源 的 存储 介质 和 备份 介质 所 确定 的 备份 类 型 ， 如 D2D、 
D2T、D2D2T 等 。 


11.2.1 备份 的 类 型 


按照 备份 的 内 容 ， 备 份 可 以 分 为 以 下 三 种 类 型 ; 

1. 完全 备份 

sc ett (full backup) 就 是 用 存储 介质 对 整个 系统 进行 备份 ， 包 括 系 统 和 数据 。 
例如 ， 每 日 下 午 1 点 用 一 盘 磁 带 对 整个 系统 进行 备份 。 这 种 备份 方式 的 优点 是 : 当 发 生 
数据 丢失 的 灾难 时 ， 只 需要 用 一 组 磁带 〈 即 灾难 发 生 之 前 最 近 备 份 的 磁带 )， 就 可 以 恢复 
丢失 的 数据 。 然 而 它 也 有 一 些 不 足 之 处 : 首先 由 于 完全 备份 的 频繁 性 ， 每 次 备份 时 ， 存 
储 磁 盘 中 的 数据 存在 大 量 的 重复 ， 如 操作 系统 与 应 用 程序 ， 这 些 重 复 的 数据 占用 了 大 量 
的 磁带 空间 ， 但 实际 上 这 部 分 数据 每 次 都 以 相同 的 内 容 被 存 入 磁盘 中 ， 这 对 用 户 来 说 就 
意味 着 增加 成 本 ; 其 次 ， 由 于 完全 备份 需要 将 所 有 数据 重新 存储 ， 备 份 所 需 的 时 间 较 长 ， 
对 于 业务 繁忙 或 资源 有 限 的 系统 来 说 ， 这 种 资源 耗 用 较 大 的 存储 策略 并 不 适合 。 

2. 增 量 备份 

增 量 备 份 〈incremental backup) 也 称 为 差异 增 量 备份 ， 是 指 在 一 次 全 备份 或 上 一 次 
增 量 备份 后 ， 以 后 每 次 只 需 备 份 与 前 一 次 相 比 增加 或 者 被 修改 的 数据 。 这 就 意味 着 ， 第 
一 次 增 量 备份 的 对 象 是 进行 全 备 后 所 产生 的 增加 和 修改 的 文件 ， 第 二 次 增 量 备份 的 对 象 
是 进行 第 一 次 增 量 备份 后 所 产生 的 增加 和 修改 的 数据 ， 以 此 类 推 。 这 种 备份 方式 最 显著 
的 优点 是 : 没有 重复 的 备份 数据 ， 因 此 备份 的 数据 量 不 大 ， 节 省 了 磁带 空间 ， 同 时 缩短 
了 备份 时 间 。 但 增 量 备份 的 缺点 在 于 ， 其 数据 恢复 比较 及 烦 ， 必 须 具 有 上 一 次 全 备份 和 
所 有 增 量 备份 磁带 。 

(1) 一 旦 丢失 或 损坏 其 中 的 一 盘 磁 带 ， 就 会 造成 恢复 失败 ， 因 为 各 盘 磁 带 的 相互 依 
赖 性 很 强 ， 任 何 一 个 节点 出 现 问题 ， 都 会 导致 整 条 备份 链 脱节 。 

(2) 它们 必须 沿 着 从 全 备份 到 依次 增 量 备份 的 时 间 顺 序 逐 个 反 推 恢复 ， 极 大 地 延长 
了 恢复 时 间 。 

3. 差分 备份 

差分 备份 (differential backup) 也 称 为 累计 增 量 备份 ， 是 指 每 次 备份 的 数据 是 相对 
于 上 一 次 全 备份 之 后 新 增加 的 和 修改 过 的 数据 。 差 分 备份 策略 有 效 避 免 了 以 上 两 种 策略 
的 缺陷 ， 同 时 又 具有 它们 的 优点 。 差 分 备份 无 需 每 天 都 做 系统 完全 备份 ， 因 此 备份 所 需 
时 间 短 ， 并 节省 磁带 空间 ， 它 的 灾难 恢复 也 很 方便 ， 系 统管 理 员 只 需 两 组 磁带 ， 即 系统 
全 备份 的 磁带 与 灾难 发 生前 一 天 的 备份 磁带 ， 就 可 以 将 系统 完全 恢复 。 
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4. 混合 备份 策略 
三 种 备份 类 型 的 优 缺 点 见 表 11-3。 


表 11-3 三 种 备份 类 型 的 优 缺 点 




















aay 备份 的 数据 更 加 全 面 , 发 生意 外 时 | 完全 备份 导致 存储 数据 重复 , 占用 
4 恢复 数据 的 时 间 短 大 量 磁盘 空间 , 备份 所 需 的 时 间 长 
数据 恢复 时 很 麻烦 , 需要 上 一 次 全 

不 会 备份 重复 数据 , 备份 数据 占用 上- 
增 量 备份 /| 差异 增 量 备份 。 | TERREN, 备份 并 备份 以 及 全 部 增 量 备份 内 容 , 数据 


恢复 时 间 长 


同时 具备 完全 备份 和 差异 增 量 备 
差分 备份 /累计 增 量 备份 份 的 优点 


数据 备份 时 间 : 完全 备份 > 增 量 备份 > 差分 备份 
数据 恢复 时 间 : 完全 备份 < 增 量 备份 < 差分 备份 


在 实际 应 用 中 ， 备 份 策略 通常 是 以 上 3 种 的 结合 。 例 如 ， 每 周一 至 周 六 进行 一 次 增 
量 备份 或 差分 备份 ， 每 周 日 进行 全 备份 ， 每 月 底 进 行 一 次 全 备份 ， 每 年 年 底 进 行 一 次 全 
备份 。 这 样 的 备份 策略 可 以 保证 数据 在 大 多 数 情 况 下 的 安全 性 。 


11.2.2 ”备份 与 恢复 操作 流程 


备份 操作 和 恢复 操作 启动 之 后 ， 备 份 系统 中 的 各 节点 之 间 会 按照 一 定 的 流程 工作 。 
1. 备份 操作 


备份 操作 过 程 如 图 11-5 所 示 。 


备份 客户 端 
备注 : 
D 由 备份 服务 器 发 起 备份 操作 ; 
D 备份 服务 器 获取 备份 相关 信 
息 ， 包 插 备份 内 容 及 备份 位 置 ; 
O 备份 客户 端 将 需要 备份 的 数 
据 发 送 至 存储 节点 ; 
© 存储 节点 再 将 数据 存储 于 备 
份 设备 中 ; 
@ 存储 节点 对 备份 服务 器 进行 
存储 反馈 ; 
© 备份 服务 器 更 新 备份 数据 的 
目录 和 状态 。 





QOO 


图 11-5 备份 操作 


(1) 由 备份 服务 器 发 起 备份 操作 。 
(2) 备份 服务 器 获取 备份 相关 信息 ， 包 括 备 份 内 容 及 备份 位 置 。 
(3) 备份 客户 端 将 需要 备份 的 数据 发 送 至 存储 节点 。 
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(4) 存储 节点 再 将 数据 存储 于 备份 设备 中 。 
(5) 存储 节点 对 备份 服务 器 进行 存储 反馈 。 
(6) 备份 服务 器 更 新 备份 数据 的 目录 和 状态 。 
2. 恢复 操作 

恢复 操作 过 程 如 图 11-6 所 示 。 

(1) 备份 服务 器 确定 需要 恢复 的 客户 端 。 
(2) 存储 设备 将 数据 传输 至 存储 节 氮 。 

(3) 存储 节点 将 数据 发 送 至 备份 客户 疹 。 
(4) 存储 节点 对 备份 服务 器 进行 恢复 反馈 。 
(5) 备份 服务 器 更 新 数据 目录 。 


备份 客户 端 


备注 : 

D 备份 服务 器 确定 需要 恢复 
存储 节点 存储 阵列 的 客户 端 ; 
@ 存储 设备 将 数据 传输 至 存 
储 节点 ; 
O 存储 节点 将 数据 发 送 至 备 
份 客户 端 ; 
@ 存储 节点 对 备份 服务 器 进 
行 恢复 反馈 ; 
© 备份 服务 器 更 新 数据 目录 。 





备份 服务 器 





OO 





图 11-6 恢复 操作 


11.3 ”备份 技术 


11.3.1 常见 的 备份 结构 


一 个 应 用 系统 的 数据 备份 决定 了 该 系统 的 可 靠 性 及 可 维护 性 ， 因 此 ， 数 据 备份 系统 
的 建设 要 充分 考虑 可 靠 性 、 可 管理 性 及 维护 成 本 等 几 方 面 的 重要 因素 。 根 据 存储 介质 与 
备份 介质 的 不 同 ， 和 常见 的 备份 结构 如 下 。 

L. 磁盘 一 磁盘 的 数据 备份 

磁盘 一 人 磁盘 (disk to disk, D2D) 的 备份 是 使 用 磁盘 阵列 作为 主 存储 介质 和 备份 存 
储 介质 的 一 种 解决 方案 ， 具 体 有 两 种 实现 方式 。 

(1) 用 户 为 备份 系统 部 署 一 套 磁盘 阵列 作为 备份 介质 ， 通 过 备份 软件 将 应 用 数据 备 
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份 到 备份 服务 器 连接 的 磁盘 阵列 中 。 

(2) 用 户 为 备份 系统 部 署 磁 盘 阵 列 作 为 备份 介质 ， 新 部 署 的 磁盘 阵列 与 现 有 的 在 线 
存储 磁盘 阵列 为 同一 品牌 、 同 一 型 号 ， 通 过 此 类 磁盘 阵列 所 具备 的 LUN 拷贝 、 快 照 或 
远程 复制 功能 将 现 有 磁盘 阵列 中 的 数据 复制 到 备份 磁盘 阵列 中 。 

2， 磁 盘 一 物理 磁带 库 的 数据 备份 

磁盘 一 物理 磁带 库 (disk to physical tape library, D2T) 的 备份 是 应 用 最 为 广泛 的 一 
种 备份 结构 ， 然 而 物理 磁带 库 的 缺憾 却 经 常 使 整个 备份 系统 的 运行 以 及 管理 面临 很 大 的 
风险 和 挑战 。 

(1) 物理 磁带 库 故 障 率 高 。 通 过 物理 磁带 库 与 备份 软件 结合 ， 可 以 方便 地 规划 备份 
策略 ， 然 而 ， 物 理 磁带 库 的 故障 却 经 常 使 得 备份 策略 无 法 正确 完成 ， 甚 至 影响 整个 系统 
的 备份 计划 。 

(2) 物理 磁带 库 的 VO 性 能 低 。 由 于 物理 磁带 的 读 写 是 顺序 进行 的 ， 无 法 像 物 理 硬 
盘 一 样 进行 随机 读 写 ， 如 果 现 有 的 IO 性 能 无 法 满足 要 求 ， 用 户 就 只 能 通过 增加 物理 磁 
带 驱 动 器 的 方式 来 提升 性 能 ， 而 部 署 物理 磁带 驱动 器 的 成 本 及 风险 相对 来 说 是 很 高 的 。 

(3) 物理 磁带 库 的 物理 磁带 的 可 靠 性 会 随 着 磁带 使 用 次 数 的 增多 而 不 断 下 降 ， 在 使 
用 物理 磁带 库 作 为 备份 介质 的 用 户 中 ， 很 多 都 经 历 过 物理 磁带 损坏 或 无 法 读 取 而 导致 数 
据 无 法 恢复 的 事故 。 

(4) 物理 磁带 的 每 盘 容量 都 是 固定 的 ， 用 户 在 创建 备份 策略 时 ， 往 往 是 确定 某 几 盘 
磁带 分 别 进行 增 量 或 差分 备份 ， 另 外 一 部 分 进行 全 备份 ， 这 就 出 现 了 用 于 进行 增 量 或 差 
分 备份 的 磁带 存储 容量 利用 率 非 常 低 的 问题 ， 在 一 定 程度 上 造成 了 用 户 投资 的 浪费 。 

3. 磁盘 一 虚拟 磁带 库 的 数据 备份 

在 磁盘 一 虚拟 磁带 库 的 数据 备份 (Disk two VIL) 的 备份 结构 中 ， 虚 拟 磁 带 库 是 采 
用 物理 硬盘 为 存储 介质 ， 通 过 虚拟 化 引擎 来 实现 机 械 手 臂 、 磁 带 驱 动 器 以 及 磁带 插 模 的 
全 新 备份 介质 解决 方案 。 由 于 没有 机 械 零 部 件 ， 虚 拟 磁 带 库 的 可 靠 性 和 可 维护 性 比 起 物 
理 磁带 库 大 大 提高 ， 与 磁盘 阵列 的 物理 可 靠 性 、 可 维护 性 相 一 致 。 虚 拟 磁带 库 采 用 了 物 
理 硬盘 作为 存储 介质 ， 物 理 硬盘 的 随机 读 写 、 高 速 寻 道 定 位 在 性 能 上 远 远 高 于 物理 磁带 
的 顺序 读 写 ; 因此， 虚拟 磁带 库 的 VO 性 能 取决 于 虚拟 磁带 库 的 对 外 连接 带宽 ， 而 非 物 
理 磁带 库 的 磁带 驱动 器 类 型 及 数量 的 总 和 。 

4， 磁 盘 一 虚拟 磁带 库 一 物理 磁带 的 数据 备份 (D2V2T ) 

D2V2T 的 数据 备份 方式 相对 而 言 是 最 合适 的 备份 方式 , 兼顾 了 可 靠 性 、 可 管理 性 以 
及 性 能 等 多 方面 的 因素 。 

虚拟 磁带 库 有 着 安 人 全、 可靠、 性 能 高 的 优点 ， 而 物理 磁带 库 相 对 来 说 有 着 支持 介质 
可 移动 的 功能 。 综 合 分 析 来 看 ， 最 好 的 解决 方案 应 该 是 如 下 诸 方 面 的 整合 。 

(1) 采用 物理 磁盘 作为 一 级 备份 介质 ， 并 通过 RAID 功能 进行 保护 ， 以 提高 性 能 和 
可 靠 性 。 

(2) 采用 虚拟 化 磁带 库 技术 确保 主机 端 备份 系统 的 可 管理 性 和 安全 性 不 受到 挑战 。 

(3) 虚拟 磁带 库 系统 能 够 支持 按 需 存储 功能 ， 充 分 利用 存储 资源 。 

(4) 虚拟 磁带 库 系统 支持 将 虚拟 磁带 导出 到 物理 磁带 的 功能 ， 方 便 备份 数据 的 归档 
保存 及 异地 保存 。 
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11.3.2 ”常见 的 备份 技术 


1. 快照 技术 

快照 (snapshot) 是 关于 指定 数据 集合 的 一 个 完全 可 用 拷贝 ， 该 拷贝 包括 相应 数据 
在 某 个 时 间 点 (拷贝 开始 的 时 间 点 ) 的 映像 。 快 照 可 以 是 数据 再 现 的 一 个 副本 或 者 复制 。 
也 就 是 说 ， 快 照 就 相当 于 一 次 备份 操作 ， 它 能 够 快速 、 简 易 恢 复 意 外 擦 除 或 损坏 的 数据 ， 
对 其 进行 在 线 数据 恢复 。 当 存储 设备 发 生 应 用 故障 或 者 文件 损坏 时 , 可 以 及 时 恢复 数据 ， 
将 数据 恢复 成 快照 产生 时 间 点 的 状态 。 快 照 技 术 将 在 第 12 章 中 详细 介绍 。 

2. 数据 复制 技术 

复制 (duplication) 是 指 将 主机 产生 的 业务 数据 写 入 主 从 两 端的 存储 系统 中 ， 以 实 
现 数据 的 容 灾 备份 。 远 程 复 制 是 容 灾 备份 的 核心 技术 ， 可 以 实现 远程 数据 同步 和 灾难 恢 
复 。 在 物理 位 置 上 分 离 的 存储 系统 ， 通 过 远程 数据 连接 功能 ， 可 以 在 远程 维护 一 套 或 多 
套数 据 副 本 。 灾 难 发 生 时 ， 分 布 在 异地 存储 系统 上 的 备份 数据 并 不 会 受到 波及 ， 从 而 实 
现 容 灾 备份 功能 。 数 据 复制 技术 将 在 第 12 章 中 详细 介绍 。 

3. 镜像 技术 

镜像 是 在 两 个 或 多 个 磁盘 或 磁盘 子 系统 上 产生 同一 个 在 线 数据 拷贝 的 信息 存储 过 
程 ， 其 产生 多 个 数据 镜像 系统 。 以 两 个 镜像 磁盘 为 例 ， 一 个 叫 主 镜像 系统 ， 另 一 个 叫 从 
镜像 系统 ， 当 两 个 磁盘 都 正常 工作 时 ， 数 据 可 以 从 任 一 磁盘 读 取 ， 如 果 一 个 磁盘 失效 ， 
则 可 以 从 另外 一 个 正常 工作 的 磁盘 读 出 数据 。 镜 像 技 术 将 在 第 12 章 中 详细 介绍 。 

4. NDMP 

网 络 数据 管理 协议 (network data management protocol, NDMP) 是 一 种 基于 企业 级 
数据 管理 的 开放 协议 。NDMP 中 定义 了 一 种 基于 网 络 的 协议 和 机 制 ， 用 于 控制 备份 、 恢 
复 ， 以 及 在 主要 和 次 要 存储 器 之 间 的 数据 传输 。 

NDMP 结构 基于 客户 机 /服务 器 模型 。 文件 备份 管理 软件 用 作客 户 机 , 也 就 是 NDMP 
数据 管理 应 用 程序 (DMA) 。 在 一 次 NDMP 会 话 中 ， 有 且 只 有 一 个 DMA。 数 据 管理 会 
话 中 的 其 他 每 个 进程 都 是 一 个 NDMP 服务 。 

NDMP 服务 具有 3 种 类 型 : 数据 服务 (data service) 、 磁 带 服务 (tape service) 和 
转换 服务 (translate service) . Æ NDMP 结构 中 , 将 网 络 附加 数据 管理 应 用 程序 (DMA)、 
数据 服务 器 和 磁带 服务 器 分 离 。NDMP 也 提供 磁带 设备 和 SCSI 介质 的 底层 控制 。 

5. 数据 保护 技术 

持续 数据 保护 〈continuous data protection, CDP) 技术 是 目前 最 热门 的 数据 保护 技 
术 ， 它 在 不 影响 主要 数据 运行 的 前 提 下 ， 可 以 捕捉 到 一 切 文件 级 或 数据 块 级 别 的 数据 写 
改动 ， 可 以 对 备份 对 象 进行 更 加 细 化 的 粒度 恢复 ， 将 其 恢复 到 任意 时 间 点 。 

CDP 技术 是 对 传统 数据 备份 技术 的 一 次 革命 性 的 重大 突破 。 传 统 的 数据 备份 解决 方 
案 专注 于 对 数据 的 周期 性 备份 上 ， 因 此 一 直 伴 随 有 备份 窗口 、 数 据 一 致 性 以 及 对 生产 系 
统 的 影响 等 问题 。 现 在 ，CDP 为 用 户 提供 了 新 的 数据 保护 手段 ， 系 统管 理 者 无 须 关 注 数 
据 的 备份 过 程 (因为 CDP 系统 会 不 断 监测 关键 数据 的 变化 ,从 而 不 断 地 自动 实现 数据 的 
保护 ), 而 只 在 灾难 发 生 后 , 简单 地 选择 需要 恢复 到 的 时 间 点 , 即 可 实现 数据 的 快速 恢复 。 

CDP 技术 包括 以 下 两 种 。 
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(1) Near CDP， 就 是 我 们 所 说 的 准 CDP， 它 的 最 大 特点 是 只 能 恢复 部 分 指定 时 间 点 
的 数据 (fixed point in time，FPIT)， 类 似 于 存储 系统 的 逻辑 快照 ， 它 无 法 恢复 任意 一 个 
时 间 点 。 

(2) True CDP， 我 们 称 之 为 真正 的 CDP， 它 可 以 恢复 指定 时 间 段 内 的 任何 一 个 时 间 
点 (any point in time, APIT). 


11.4 重复 数据 删除 技术 及 应 用 


11.4.1 重复 数据 删除 技术 概述 


重复 数据 删除 Cdeduplication) 技术 ， 简 单 来 说 ， 就 是 一 种 消除 重复 数据 的 技术 ， 它 
用 软件 或 硬件 的 方式 ， 对 存储 数据 进行 处 理 ， 以 消除 其 中 的 重复 数据 ， 从 而 减 小 数据 占 
用 的 存储 空间 。 

在 备份 系统 中 ， 数 据 在 备份 服务 器 的 控制 下 ， 从 备份 客户 端 〈 源 端 ) 传输 到 备份 设 
备 〈 目 标 端 )， 根 据 重 复数 据 删除 操作 发 生 的 位 置 ， 可 以 将 其 分 为 源 端 重复 数据 删除 
(deduplication at the source) 和 目标 端 重复 数据 删除 (deduplication at the target). Wim € 
复数 据 删 除 指 的 是 : 备份 客户 端 将 数据 传输 给 备份 设备 之 前 ,首先 对 这 些 数据 进行 处 理 ， 
以 删除 其 中 的 重复 数据 ， 然 后 将 删除 得 到 的 没有 重复 的 数据 发 送 给 备份 设备 。 目 标 端 重 
复数 据 删 除 指 的 是 : 数据 从 备份 客户 端 发 送 时 ， 并 没有 经 过 重复 数据 删除 ， 只 有 在 到 达 
备份 设备 时 ， 才 由 备份 设备 来 执行 重复 数据 删除 。 

在 目标 端 重复 数据 删除 中 ， 根 据 重 复数 据 删除 操作 发 生 的 时 间 ， 又 可 以 将 目标 端 重 
复数 据 删 除 分 为 在 线 处 理 重 复数 据 删 除 (inline deduplication) 和 后 处 理 重 复数 据 删 除 
(post processing deduplication, \ 3+ Xi offline deduplication 的 叫 法 ， 即 offline 重复 数据 
删除 )。 

1. 在 线 处 理 重复 数据 删除 

在 线 处 理 重 复数 据 删除 指 的 是 : 备份 设备 在 接收 备份 数据 的 同时 执行 重复 数据 删除 
操作 ， 即 一 边 接收 数据 ， 一 边 做 重复 删除 操作 ， 备 份 数据 接收 完成 时 ， 重 复数 据 删 除 操 
作 也 执行 完毕 。 

2. 后 处 理 重复 数据 删除 

后 处 理 重复 数据 删除 指 的 是 : 备份 结束 后 ， 备 份 设备 才 开 始 执行 重复 数据 删除 操 
作 ， 即 备份 设备 接收 完 所 有 的 备份 数据 后 ， 在 某 一 时 刻 才 开始 对 备份 数据 执行 重复 数 
据 删 除 。 

无 论 采 用 何 种 重复 数据 删除 技术 ， 其 终极 目的 都 是 消除 重复 数据 ， 因 而 都 会 涉及 将 
新 数据 和 已 有 数据 进行 比较 ， 以 判断 新 数据 是 否 重 复 的 过 程 。 识 别 重复 数据 的 方法 主要 
有 以 下 两 类 。 

(1) 基于 内 容 的 比较 方法 : 直接 比较 数据 本 喘 以 识别 重复 数据 。 

(2) 基于 索引 的 比较 方法 : 通过 比较 数据 的 索引 以 识别 重复 数据 。 数 据 的 索引 是 指 ， 
系统 将 数据 划分 为 定 长 或 不 定 长 的 数据 块 ， 然 后 以 每 个 数据 块 为 输入 ， 使 用 一 定 的 算法 
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计算 出 一 个 唯一 的 值 ， 该 值 即 为 该 数据 块 的 索引 。 

在 基于 索引 的 比较 方法 中 ， 由 于 索引 存储 空间 远 小 于 其 对 应 数据 块 的 存储 空间 ， 所 
以 索引 的 比较 操作 可 以 直接 在 内 存 中 执行 ,其 效率 显著 高 于 基于 内 容 的 比较 方法 。 当 前 ， 
基于 索引 的 比较 方法 已 经 在 众多 重复 数据 删除 技术 中 应 用 。 


11.4.2 ”重复 数据 删除 的 应 用 


随 着 数据 的 爆炸 式 增长 ， 传 统 磁 带 备 份 系统 的 备份 恢复 速率 已 无 法 满足 用 户 的 备份 
需求 。 随 着 磁盘 技术 的 快速 发 展 ， 磁 盘 介质 的 容量 得 到 了 很 大 的 提高 ， 单 位 容量 磁盘 存 
储 的 价格 也 大 幅 下 跌 ,， 基 于 SATA 磁盘 的 备份 系统 已 经 在 用 户 IT 环境 中 大 量 部 署 , 并 以 
其 高 备份 恢复 性 能 而 逐渐 为 用 户 青 睐 ，VTL 就 是 其 中 具有 代表 性 的 产品 。VTL 产品 兼 有 
磁盘 设备 的 高 性 能 、 易 维护 和 磁带 设备 先进 成 熟 的 介质 管理 等 优点 ， 一 经 推出 ， 即 获得 
了 民 好 的 发 展 和 成 长 ， 市 场 前 景 极为 广阔 。 

华为 产品 YTL6900 是 一 款 面向 中 高 端 用 户 的 虚拟 磁带 库 产品 ， 它 支持 重复 数据 删 
BR. HA 集群 以 及 磁盘 休眠 技术 ， 并 以 此 作为 解决 中 高 端 用 户 面临 的 诸多 问题 的 切入 点 。 
下 面 介绍 VTL6900 中 运用 的 重复 数据 删除 技术 。 

1. Post processing 重复 数据 删除 技术 

VTL6900 支持 的 Postprocessing 重复 数据 删除 技术 的 数据 比较 方法 为 索引 比较 方法 。 

在 Post processing 重复 数据 删除 模式 中 ，VTL6900 软件 包含 两 个 模块 : VTL 模块 和 
SIR 模块 。VTL6900 的 存储 空间 逻辑 上 被 划分 为 两 部 分 , 分 别称 为 VTL 模块 和 SIR 模块 
所 用 ， 分 别称 为 VTL 存储 空间 (又 称 为 Cache) 和 SIR EHZ (URA Repository). 
VTL6900 接收 到 备份 数据 后 ， 首 先 将 其 存放 于 VITL 存储 空间 ， 此 后 的 某 个 时 刻 〈 如 某 
时 间 点 、 备 份 结束 、 达 到 存储 水 位 等 )，SIR 模块 会 读 取 这 些 数据 ， 并 将 其 和 SIR 存储 空 
间 中 己 有 的 不 同 数据 块 进行 比较 : SIR 模块 将 原始 备份 数据 划分 为 大 小 为 若干 KB 的 数 
据 块 ， 然 后 使 用 SHA-1 算法 为 每 个 数据 块 计 算出 一 个 哈 希 值 〈 又 称 为 索引 /Index)， 通 过 
比较 新 数据 块 和 已 有 数据 块 的 哈 希 值 来 确定 
新 数据 块 是 否 重复 , 重复 的 数据 块 将 被 丢弃 ， 

而 仅 保留 其 数据 块 指针 ， 这 时 全 新 的 数据 块 
才 会 被 存放 到 SIR 存储 空间 如 图 11-7 所 示 。 

在 VTL6900 中 ， 运 行 VTL 软件 模块 应 Pika 
用 的 实体 物理 机 以 及 运行 于 其 上 的 VTL 软件 Data De-duplication 
模块 应 用 统称 为 VTL 引擎 , 运行 SIR 软件 模 
块 应 用 的 实体 物理 机 以 及 运行 于 其 上 的 SIR 
软件 模块 应 用 统称 为 SIR 引擎 。VTL 引擎 必 
须 配 置 ， 以 支持 对 外 提供 虚拟 磁带 库 服务 ; SIR 引擎 为 可 选 配 置 ， 用 于 提供 重复 数据 删 
除 功 能 。 

SIR 引擎 执行 重复 数据 删除 之 前 ，VTL 存储 空间 中 的 备份 数据 以 虚拟 磁带 的 形式 存 
放 ， 如 图 11-8 所 示 。 重 复 删 除 执行 后 ， 虚 拟 磁带 中 的 数据 被 指针 替代 〈 此 时 的 虚拟 磁带 
PRA VIT (virtual index tape))， 该 指针 指向 SIR 存储 空间 中 的 单一 实例 数据 块 ， 所 释放 
的 VIL 存储 空间 用 于 存储 新 的 备份 数据 ， 如 图 11-9 所 示 。 
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11-9 VTL6900 中 重复 数据 删除 后 的 数据 分 布 


前 面 已 经 说 明 ， 在 Post processing 重复 数据 删除 模式 中 ，VTL6900 存储 空间 逻辑 上 
被 划分 VIL 存储 空间 和 SIR 存储 空间 两 部 分 , 即 Cache 和 Repository 两 部 分 , 其 中 , SIR 
存储 空间 又 被 划分 为 SIR data disk 和 SIR index disk 两 部 分 。SIR data disk 中 存放 重复 数 
据 删除 后 的 不 同 数据 块 ， 新 备份 到 Cache 中 的 数据 和 SIR data disk 中 的 数据 块 进行 比较 
以 确定 其 是 否 重复 。SIR index disk 中 存放 SIR data disk 中 所 有 数据 块 的 索引 ， 即 SHA-1 
哈 希 值 ， 可 见 ，SIR data disk ÈK, SIR index disk 就 越 大 。 在 SIR 模块 运行 过 程 中 ， 将 
SIR index disk 中 的 所 有 索引 (索引 表 ) 读 取 到 SIR 引擎 的 内 存 中 , 快速 完成 索引 表 查 找 ， 
SIR index disk ÈK, SIR 引擎 需要 配置 的 内 存 容量 也 越 大 。 

2. Inline 重复 数据 删除 技术 
= VTL6900 支持 的 Inline 重复 数据 删除 技术 的 数据 比较 方法 也 为 索引 比较 方法 。 在 
Inline 重复 数据 删除 模式 中 ,VTL6900 软件 包含 两 个 模块 :VTL 模块 和 SIR 模块 。VTL6900 
在 接收 到 备份 数据 时 ，Inline Parser 会 同步 将 内 存 中 的 原始 备份 数据 划分 为 大 小 为 若干 
KB 的 数据 块 ， 然 后 使 用 SHA-1 算法 为 每 个 数据 块 计 算出 一 个 哈 希 值 〈 又 称 为 索引 
/Index)。 同 时 ，SIR 模块 会 在 内 存 中 同步 地 比较 新 数据 块 和 已 有 数据 块 的 哈 希 值 ， 以 确 
定 新 数据 块 是 否 重 复 ， 重 复 的 数据 块 将 被 丢弃 ， 而 仅 保留 其 数据 块 指针 ， 这 时 全 新 的 数 
据 块 才 会 被 存放 到 SIR 存储 空间 。 


11.5 ”华为 备份 系统 及 其 应 用 场景 


传统 备份 方案 包含 了 备份 服务 器 、 存 储 交 换 机 (可 选 )、 备 份 介质 (存储 阵列 、 磁 
带 库 等 )、 备 份 软件 。 硬 件 设备 形态 多 样 ， 厂 家 品牌 各 异 ， 用 户 常常 面临 设备 兼容 性 差 ， 
选 型 过 程 繁琐 ,系统 维护 困难 ， 人 员 技 能 要 求 高 ， 整 体 成 本 高 昂 等 问题 。 其 中 ， 备 份 系 
统 的 管理 维护 工作 繁琐 问题 最 为 关键 。 首 先 ， 备 份 系统 的 软 硬 件 独立 管理 ， 分 别 维护 ， 
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没有 一 个 统一 的 界面 可 以 查询 硬件 平台 和 备份 软件 的 状态 信息 。 其 次 ， 当 系统 故障 后 ， 

系统 管理 员 需 要 分 别 收集 备份 系统 中 所 有 部 件 的 日 志 信息 ， 这 可 能 还 需要 各 个 厂家 服务 
工程 师 的 远程 技术 支持 ， 整 个 过 程 繁琐 而 且 耗 时 。 最 后 ， 在 日 常 巡 检 中 ， 需 要 维护 工程 
师 通 过 不 同 的 命令 行 接口 和 管理 界面 确定 备份 系统 的 各 组 件 是 否 正常 工作 ， 操 作 复杂 、 

工作 量 大 。 华 为 产品 HDP3500E 提出 了 针对 这 些 问题 的 恨 好 解决 方案 。 下 面 将 从 
HDP3500E 的 软 硬 件 、 应 用 场景 、 操 作 特 性 等 方面 介绍 其 备份 技术 。 

HDP3S00E 备份 系统 

l. 产品 概述 

传统 松 耦 合 的 备份 系统 的 备份 服务 器 、 备 份 介质 、 备 份 软件 是 分 开 管理 的 ， 并 由 各 
设备 厂商 独立 维护 。 备 份 系统 出 现 问题 时 ， 如 何 进行 故障 定位 ， 并 协调 各 厂商 进行 维护 
是 个 长 期 困扰 用 户 的 难题 。 

HDP3500E 是 一 款 采 用 一 体 化 设计 的 产品 ， 集 备份 服务 器 、 备 份 介质 、 备 份 软件 于 
一 身 ， 回 用 户 提供 统一 的 专业 维 保 服 务 ， 解 决 了 松 耦 合 备份 系统 面临 的 维护 难题 ， 并 提 
供 图 形 化 的 管理 系统 与 命令 行 管理 工具 。 用 户 可 以 轻松 地 对 备份 系统 的 软 硬 件 设 备 进行 
统一 管理 和 维护 ， 快 速 定位 故障 ， 大 大 降低 了 运 维 
的 难度 。DHP3500E 的 外 观 如 图 11-10 所 示 。 

OceanStor HDP3500E 备份 设备 具有 以 下 特点 。 

强大 的 数据 保护 能 力 。 
快速 简便 的 部 署 。 
高 性 价 比 。 
高 可 靠 性 。 
高 可 用 性 。 11-10 HDP3500E 外 观 
良好 的 可 维护 性 。 
简便 的 管理 能 力 。 
绿色 节能 。 
.硬件 
HDP3500E 将 备份 服务 器 、 备 份 介质 融 为 一 体 。 
e 配置 2 个 Intel E5 CPU，16GB 内 存 (8GB DDR3/ 条 ) ， 具 有 强大 的 备份 数据 处 
理 能 力 。 
o 支持 12 块 2TB NL-SAS 硬盘 做 数据 盘 ， 位 于 设备 前 端 ， 通 过 背 板 〈 集 成 扩展 器 ) 
与 电源 、 磁 盘 控制 器 等 部 件 连接 ， 从 而 构建 起 一 个 高 可 靠 的 磁盘 系统 。 

通过 整合 备份 系统 硬件 资源 ，HDP3500E 能 够 很 好 地 满足 备份 数据 存储 需求 ， 最 大 
限度 降低 维护 难度 ， 减 轻 维护 人 员 的 工作 ， 降 低 备 份 系统 总 体 成 本 。 

HDP3500E 拥有 良好 的 备份 容 灾 设备 。 除 了 磁盘 控制 器 提供 的 RAID1、RAID6 级 别 
的 保护 之 外 ，HDP3500E 每 2 周 自动 运行 一 次 系统 自 喘 的 备份 ， 并 提供 三 张 恢复 光盘 ， 
支持 在 HDP3500E 备份 系统 运行 故障 时 , 快速 恢复 系统 。 进 行 恢复 前 , 需要 对 HDP3500E 
系统 进行 备份 ， 并 保存 关键 数据 ， 以 便于 快速 恢复 。 

灾难 恢复 主要 包括 如 下 两 个 场景 。 

(1) 数据 盘 未 损坏 的 HDP3500E 系统 故障 恢复 。 数 据 盘 未 损坏 的 HDP3500E 系统 故障 
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会 导致 业务 不 可 用 ， 通 过 系统 恢复 ， 不 会 导致 数据 丢失 。 

(2) 单 台 HDP3500E 所 有 数据 全 部 丢失 的 系统 故障 恢复 。 此 种 系统 故障 恢复 只 针对 某 
一 台 HDP3500E 的 数据 盘 RAID 组 失效 或 者 误 操 作 导 致 所 有 14 块 硬盘 数据 被 清空 的 情 
况 ， 通 过 系统 恢复 将 HDP3500E 恢复 到 出 厂 状 态 ，HDP3500E 服务 器 上 的 数据 将 全 部 
FR. 

3. 软件 介绍 

HDP3500E 集成 NetBackup 企业 级 备份 软件 ， 文 持 Windows, Linux. UNIX 操作 系 
统 平 台 多 种 应 用 数据 的 备份 恢复 ， 文 持 多 种 备份 类 型 ， 提 供 备 份 策 略 的 集中 管理 和 备份 
作业 的 自动 调度 ，HDP3500E ISM 管理 界面 首页 如 图 11-11 所 示 。 


OceanStor ISM 


am 


E PeR 
E 备份 服务 器 狼 量 
ONERE 


W SAFE GEY) @ AWE GBD 


| RESH 
2011-07-26 13:55:09 
2011-07-26 13:55:09 
2011-07-26 13:55;09 
2011-07-26 13:55:00 
2011-07-26 1355:09 





11-11 HDP3500E ISM 管理 界面 首页 


NetBackup = /2 3844 (% HDP3500E 具有 强大 的 可 扩展 性 ，Master Server 是 备份 系统 
的 核心 ， 对 整个 备份 域 做 统一 管理 ，Media Server 连接 存储 设备 ， 完 成 备份 作业 ，Client 
部 署 在 需要 备份 的 业务 系统 上 。HDP3500E 设备 既 可 配置 为 Master Server， 也 可 以 配置 
为 Media Server， 用 户 可 以 根据 应 用 系统 数量 和 备份 数据 总 量 部 署 一 台 或 者 多 台 
HDP3500E， 在 多 人 台 HDP3500E 之 间 轻 松 实现 备份 策略 和 备份 空间 的 统一 管理 。NBU = 
层 染 构 示意 图 如 图 11-12 所 示 。 

NetBackup for NDMP 是 可 选 的 NetBackup 应 用 程序 。 它 允许 NetBackup 使 用 网 络 数 
据 管 理 协 议 (NDMP) 启动 和 控制 网 络 挂 接 存储 (NAS) 系统 的 备份 和 还 原 。 

NDMP 是 一 种 被 广泛 采用 的 协议 ， 符 合 NDMP 的 备份 应 用 程序 可 通过 该 协议 控制 
运行 NDMP 服务 器 应 用 程序 的 任何 NDMP 主机 的 备份 和 还 原 。 
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NDMP 体系 结构 遵循 客户 端 /服务 器 模型 。 
e 安装 了 NetBackup for NDMP 的 NetBackup 主 服务 器 或 介质 服务 器 称 为 NetBackup 
for NDMP 服务 器 。 
e NDMP 服务 器 应 用 程序 所 驻 留 的 主机 称 为 NDMP 主机 。 
e NetBackup 软件 是 NDMP 服务 器 应 用 程序 的 客户 端 。NetBackup for NDMPNet 
Backup 充当 NDMP 客户 端 。 男 一 方面 ，NDMP 主机 充当 NetBackup 客户 端 。 
HDP3500E 支持 通过 NDMP 协议 将 NDMP Host (NAS HLA) 系统 中 的 数据 备份 到 
HDP3500E 并 进行 恢复 。 注 意 : NDMP 主机 无 需 安装 NBU agent. NDMP 数据 备份 示意 
图 如 图 11-13 所 示 。 


图 11-12 
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11-13 NDMP 数据 备份 示意 图 


232 信息 存储 与 IT 管理 


4. 典型 应 用 场景 

(1) HDP3500E 的 快速 备份 恢复 

HDP3500E 支持 BMR (Bare Metal Restore) 操作 系统 快速 备份 恢复 。BMR 可 自动 
化 和 人 简化 服务 器 恢复 过 程 ， 避 免 了 手动 重新 安装 操作 系统 或 配置 硬件 ， 还 可 以 在 短 时 间 
内 还 原 服务 器 ， 而 无 需 过 多 的 培训 或 枯燥 的 管理 ， 是 一 种 傻瓜 式 、 部 署 简单 、 经 济 的 灾 
难 恢 复方 法 。 

BMR 组 件 包含 3 部 分 : BMR ERZ BMR 启动 服务 器 、BMR 客户 机 如 图 11-14 
所 示 。BMR 还 原 操作 系统 、 系 统 配置 以 及 所 有 系统 文件 和 数据 文件 的 操作 步骤 如 下 。 


1. 准备 恢复 〈 选 择 是 介质 引导 还 是 网 络 引导 ) 
HDP3500E 获取 客户 端 配置 信息 
HDP3500E 生成 客户 端 恢复 流程 


HDP3500E 分 配 Boot Servers 
Cif Network Boot) 






2. 用 户 执行 网 络 启动 /光盘 启动 


引导 映 象 传 到 BMR 客户 端 
客户 端 从 BMR Boot server 存 取 SRT 


客户 端 获取 恢复 流程 


客户 端 执行 恢复 流程 
BMR Boot Server BMR Client (configures disk,restores data from NetBackup ) 


客户 端 重新 引导 


人 





HDP3500E 释放 Boot Servers 


11-14 BMR 执行 流程 示意 图 


(2) HDP3500E 的 文件 系统 归档 

HDP3500E 文 持 文件 系统 的 归档 。 用 户 可 调用 归档 策略 ， 实 现 数据 备份 后 ， 删 除 原 
始 数据 的 功能 。 原 始 数据 删除 后 ， 用 户 将 不 可 再 使 用 。 如 果 需 要 使 用 ， 则 需要 恢复 归档 
数据 到 原始 位 置 。 

用 户 存 档 通 过 “备份 、 存 档 和 还 原 ” 界 面 启动 。 用 户 存档 备份 首先 备份 用 户 指 定 的 
文件 。 如 果 备 份 成 功 ， 将 从 本 地 磁盘 中 删除 这 些 文件 。 存 档 备份 释放 本 地 磁盘 空间 ， 同 
时 保留 一 个 副本 供 以 后 使 用 。 副 本 在 保留 期 限 内 保留 。 用 户 只 能 在 日 程 表 的 “启动 时 段 ” 
选项 卡 中 指定 的 时 间 内 启动 存档 。 

(3) HDP3500 的 远程 复制 备份 

通过 Storage Lifecycle Policy 方式 , 实现 非 重 删 数据 备份 集 远程 复制 。 本 地 与 异地 中 
心 必须 属于 同一 备份 域 ， 备 份 集 为 非 重 删 数 据 。 可 以 自 定义 备用 备份 集 。 

备份 数据 首先 通过 业务 平面 从 业务 服务 器 备份 到 本 地 备份 系统 ， 再 通过 WAN 迁移 
到 异地 备份 系统 灾难 恢复 ， 在 异地 中 心 重新 部 署 NBU Master， 构 建 一 个 新 的 备份 域 ， 将 
包含 备份 数据 的 NBU Media 导入 新 的 备份 域 ， 然 后 通过 异地 中 心 的 LAN 网 络 恢复 到 备 
用 的 业务 服务 器 。 非 重 删 数 据 远 程 复制 示意 图 如 图 11-15 所 示 。 
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图 11-15 非 重 删 数据 远程 复制 示意 图 


5， 操 作 与 管理 

HDP3500E 充分 考虑 了 设备 维护 时 面临 的 备份 系统 的 管理 维护 工作 繁琐 等 问题 ， 提 
供 了 设备 配置 显示 、 信 息 收 集 、 一 键 巡 检 等 工具 包 ， 大 大 简化 了 设备 管理 维护 的 难度 。 

(1) 提供 设备 配置 显示 工具 ， 管 理 员 通 过 一 个 命令 即 可 查询 备份 系统 的 硬件 平台 、 
OS、 备 份 软件 等 组 件 的 版 本 信息 ， 简 单 易 用 。 

(2) 专门 设计 了 一 键 式 信息 收集 工具 ， 系 统管 理 员 只 需 执 行 一 个 信息 收集 命令 ， 即 可 
完成 整个 系统 的 日 志和 其 他 信息 收集 ， 极 大 地 降低 了 日 志 收 集 难 度 ， 缩 短 了 日 志 收 集 时 间 。 

(3) 针对 备份 系统 关键 部 件 的 健康 状态 检查 还 提供 了 一 键 了 巡 检 的 工具 ， 管 理 人 员 通 
过 命令 行 可 以 快速 检查 备份 系统 关键 部 件 的 状态 ， 完 成 巡 检 工作 。 


11.6 本 章 总 总 结 


完成 本 章 学 习 ， 将 能 够 : 

。 了 解 备份 的 基础 知识 

了 解 备份 的 拓扑 结构 。 

了 解 备份 使 用 的 几 种 常见 技术 。 

了 解 备 份 技术 在 华为 产品 中 的 实现 与 应 用 。 


11.7 练习 题 


一 、 选 择 题 
1. 在 备份 方案 中 ， 描 述 数 据 恢复 所 需 时 间 的 指标 是 ( e 
A. RPO B. RTO C. D2D D. D2T 


234 信息 存储 与 IT 管理 


答案 (B) 
2. 按 备 份 的 数据 量 ， 备 份 技术 可 以 分 为 〈 
A. 差分 备份 B. 全 备份 C. 按 需 备份 D. 增 量 备份 
答案 (ABD) 
3. 属于 备份 的 六 大 原则 的 有 ( )e 
A. 稳定 性 B. 操作 简单 C. 容 灾 考虑 D. 安全 性 
答案 (ABC) 
二 、 简 答题 
1. 简 述 重复 数据 删除 技术 的 概念 。 


2. 简 述 备份 技术 在 华为 产品 中 的 应 用 。 








12.1 BR 

12.22 ” 容 灾 方案 涉及 的 基本 概念 
12.3 ”快照 技术 

12.4 ”镜像 技术 

12.5 复制 技术 

12.6 ” 容 灾 技术 的 实现 方式 

12.7 构建 容 灾 解决 方案 

12.8 ”华为 容 灾 方案 的 实现 和 应 用 
12.9 本章 总 结 

12.10 ”练习 题 





关于 本 章 


容 灾 系 统 是 指 在 相隔 较 远 的 异地 ， 建 立 两 套 或 多 套 功能 相同 的 IT 系统 ， 互 相 之 间 可 以 进 
行 健康 状态 监视 和 功能 切换 。 容 灾 技 术 是 系统 高 可 用 性 技术 的 一 个 组 成 部 分 ， 容 灾 系 统 更 加 
强调 处 理 外 界 环 境 对 系统 的 影响 ， 特 别 是 灾难 性 事件 对 整个 IT 节点 的 影响 ， 提 供 节 点 级 别 的 
系统 恢复 功能 。 

当 数 据 中 心 因 灾 难 不 能 工作 时 ， 备 份 的 副本 将 用 于 在 第 二 地 点 恢复 数据 。 因 此 容 灾 是 生 
产 系 统 中 非常 重要 的 环节 ， 它 尽 可 能 地 减少 生产 系统 的 数据 丢失 ， 保 持 生 产 系 统 的 业务 不 间 
断 运行 ， 从 而 避免 灾难 市 来 的 数据 损失 ， 并 保证 生产 系统 效率 的 持续 性 。 

本 章 将 介绍 容 灾 的 定义 、 容 灾 的 关键 指标 RPO0 与 RTO、 容 灾 的 类 型 以 及 企业 基于 RPO 
和 RTO 的 要 求 所 实施 的 灾难 恢复 数据 保护 策略 ， 近 年 来 充分 运用 于 容 灾 的 3 种 技术 : 快照 技 
术 、 镜 像 技术 、 复 制 技 术 ， 以 及 容 灾 系统 基于 这 3 种 技术 的 实现 方式 。 在 本 章 的 结尾 ， 将 介 
绍 华为 在 容 灾 方案 方面 的 相关 技术 与 产品 。 


238 言 息 存储 与 IT 管理 


12.1 BR 


12.1.1 容 灾 概 述 


容 灾 ， 就 是 除 生 产 站 点 以 外 ， 男 外 建立 容 灾 站 点 。 当 灾难 发 生 时 ， 容 灾 站 点 可 以 接 
管 业务 ， 尽 可 能 地 减少 生产 系统 的 数据 丢失 ， 保 持 生 产 系统 的 业务 不 间断 的 运行 。 

在 容 灾 系统 中 ， 数 据 备 份 是 容 灾 的 基础 。 备 份 是 指 为 了 防止 系统 遭受 人 为 的 误 操 作 
或 者 其 他 故障 导致 数据 丢失 ， 而 采取 的 将 全 部 或 部 分 数据 从 应 用 主机 的 存储 设备 复制 到 
其 他 存储 设备 的 过 程 。 无 论 采 取 何 种 容 灾 方 案 ， 都 不 可 能 脱离 备份 的 数据 而 实现 。 

L. 容 灾 需求 分 析 

在 建立 容 灾 系统 之 前 ， 要 通过 全 面 的 需求 分 析 来 确定 容 灾 系统 所 需 的 指标 。 需 求 分 
析 包 括 业 务 系统 风险 分 析 、 业 务 影响 分 析 和 成 本 分 析 。 

C1) 风险 分 析 

风险 分 析 是 确定 哪些 是 可 能 造成 数据 损失 或 者 系统 瘫痪 的 外 在 和 内 在 因素 。 既 然 是 
容 灾 ， 就 必须 充分 考虑 业务 系统 所 在 地 的 自然 环境 ， 对 可 能 发 生 的 灾难 ， 准 备 相 应 的 容 
灾 对 策 。 

(2) 业务 影响 分 析 

业务 影响 分 析 (business impact analysis, BIA) 也 称 作 业务 影响 评估 (business impact 
assessment)， 分 析 灾 难 风险 对 组 织 运营 的 影响 方式 ， 识 别 并 量化 必要 的 容 灾 管理 能 力 。 
APR, BIA 就 以 下 问题 达成 一 致 的 认识 。 

。 天 键 经 营 过 程 的 识别 和 临界 状态 、 职 能 和 相关 资源 以 及 组 织 已 有 的 关键 互相 依存 

关系 。 

。 灾难 事项 对 实现 重要 业务 目标 的 能 力 会 产生 的 影响 。 

。 管理 干扰 的 影响 以 及 使 组 织 恢复 到 约定 运行 水 平 所 需 的 能 力 。 

(3) 成 本 分 析 

建立 容 火 系统 ， 需 要 购买 必要 的 设备 ， 并 考虑 系统 维护 管理 成 本 和 使 用 通信 线路 的 
费用 。 这 些 容 灾 成 本 也 是 构建 容 灾 系统 必须 考虑 的 因素 。 

2. ERRA 

在 今天 的 大 多 数 容 灾 系统 中 ， 从 对 系统 的 保护 程度 来 分 ， 可 以 分 为 数据 级 容 灾 、 应 
用 级 容 灾 和 业务 级 容 灾 。 

(1) 数据 级 容 灾 

在 容 灾 数 据 中 心 建立 对 应 的 数据 系统 ， 作 为 数据 备份 ， 而 且 该 数据 备份 是 本 地 全 部 
数据 的 可 用 复制 。 当 本 地 的 数据 系统 发 生 不 可 避免 的 灾难 时 ， 容 灾 数 据 中 心 的 数据 备份 
系统 能 够 迅速 恢复 丢失 的 数据 。 备 份 数据 可 以 是 与 本 地 数据 的 完全 实时 复制 ， 也 可 以 比 
本 地 数据 略微 延 时 ， 但 一 定 是 可 用 的 。 

(2) 应 用 级 容 灾 

在 数据 容 灾 的 基础 上 ， 在 容 灾 数据 中 心 建立 一 套 完整 的 与 本 地 生产 系统 相当 的 备份 
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应 用 系统 。 建 立 这 样 一 个 备份 应 用 系统 比 只 备份 数据 复杂 得 多 ， 其 中 需要 包含 多 种 其 他 
资源 与 技术 : 主要 的 资源 包括 网 络 、 主 机 、 应 用 等 ， 其 间 还 需要 良好 地 协调 各 资源 之 间 
的 调用 关系 ; 主要 的 技术 包括 负载 均衡 、 集 群 技 术 。 

(3) 业务 级 容 灾 

包含 IT 系统 的 容 灾 。 数 据 级 容 灾 和 应 用 级 容 灾 都 是 在 IT 范畴 之 内 ， 然 而 对 于 正常 
业务 而 言 ， 仅 保障 其 IT 系统 是 不 够 的 。 因此 有 些 用 户 还 需要 构建 最 高 级 别 的 业务 级 别 容 
灾 。 业 务 级 容 灾 的 大 部 分 内 容 是 非 IT 系统 ， 如 电话 、 办 公 地 点 等 。 当 一 场 大 的 灾难 发 生 
时 ， 用 户 原 有 的 办 公 场 所 都 会 受到 破坏 ， 用 户 除了 需要 原 有 的 数据 和 应 用 系统 外 ， 更 需 
要 工作 人 员 在 一 个 备份 的 工作 场所 正常 地 开展 业务 。 


12.12 ” 容 灾 的 应 用 场景 


2005 年 4 月 国务 院 信息 化 办 公 室 出 台 的 《重要 信息 系统 灾难 恢复 规划 指南 》 中 明确 
定义 :“ 灾 难 是 由 于 人 为 或 自然 的 原因 ， 造 成 信息 系统 运行 严重 故障 或 瘫痪 ， 使 信息 系统 
支持 的 业务 功能 停顿 或 服务 水 平 不 可 接受 、 达 到 特定 的 时 间 的 突 发 性 事件 , 通常 导致 信息 
系统 需要 切换 到 备用 场地 运行 。” 由 此 可 见 ， 灾 难 不 仅 指 自然 的 原因 ， 也 包括 人 为 的 原因 。 

在 信息 系统 中 ， 一 切 能 导致 系统 非 正常 停机 的 事件 都 可 以 称 为 灾难 。 灾 难 大 致 可 以 
分 成 以 下 4 种 。 

。 自然 灾害 : 包括 地 震 、 洪 水 、 雷 电 等 ， 这 种 灾难 破坏 性 大 ， 影 响 面 广 。 

© 社会 灾难 : GINS. KK. AAS. 

。 IT 系统 灾难 : 包括 主机 的 CPU、 硬 盘 等 损坏 ， 电 源 中 断 以 及 网 络 故障 等 ， 这 类 
灾难 影响 范围 比较 小 ， 破 坏 性 小 。 

。 人 为 灾难 : 包括 黑客 攻击 、 病 毒 侵入 、 误 操作 、 蓄 意 破 坏 等 。 对 人 为 灾难 的 解决 ， 
属于 广义 的 容 灾 的 范畴 。 但 狭义 上 , 还 是 主要 依靠 备份 。 因 为 容 灾 通常 是 依靠 镜 
像 和 复制 ,一旦 主 端 感染 病毒 , 或 者 误 删 了 数据 ， 从 端 会 被 同步 修改 。 此 时 ， 需 
要 靠 备份 的 历史 数据 来 恢复 。 


12.2 ” 容 灾 方案 涉及 的 基本 概念 


12.2.1 ” 容 灾 中 数据 的 一 致 性 


1. 数据 一 致 性 

数据 一 致 性 ， 就 是 当 多 个 用 户 试图 同时 访问 一 个 数据 库 ， 它 们 的 事务 同时 访问 相同 
的 数据 时 ， 读 取 到 的 数据 完全 相同 。 如 果 数 据 不 一 致 ， 可 能 会 发 生 以 下 4 种 情况 : 丢失 
更 新 、 未 确定 的 相关 性 、 不 一 致 的 分 析 和 幻像 读 。 因 此 在 容 灾 数据 复制 的 应 用 中 ， 保 持 
数据 的 一 致 性 是 决定 容 灾 效果 的 关键 。 

2. 数据 的 不 一 致 性 

数据 的 不 一 致 性 通常 是 因为 异步 传输 过 程 中 每 个 远程 拷贝 的 IO 可 能 出 现 的 失败 与 
Elk, 现在 的 容 灾 系统 大 多 采用 时 间 惟 (time stamp) 技术 来 保证 同步 过 程 中 的 数据 一 致 
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性 ， 其 主要 过 程 如 下 。 

(1) 在 每 一 个 异步 IO 操作 中 加 上 时 间 标 签 。 

(2) 每 当 收 到 来 自主 机 的 一 个 写 更 新 时 ， 生 产 磁 盘 控 制 器 立即 返回 一 个 IO 完成 的 
应 答 ， 并 将 数据 放置 到 控制 器 CACHE 中 的 一 个 文件 中 。 

(3) 应 用 软件 定期 地 或 在 磁盘 控制 器 达到 茶 个 临界 状态 时 ， 收 集 来 自 所 有 控制 器 的 
更 新 数据 。 

(4) 根据 更 新 记录 上 的 时 间 惟 ， 重 新 编排 更 新 记录 《将 这 组 记录 称 为 数据 分 组 号 )， 
使 其 能 够 保证 数据 和 顺序 更 新 完整 性 ， 然 后 一 次 性 地 用 这 组 记录 去 更 新 备份 磁盘 。 

(5) 这 个 数据 一 致 组 保证 备份 磁盘 系统 的 更 新 与 生产 磁盘 系统 有 完全 相同 的 顺序 ， 
即 顺 序 的 完整 性 。 


12.2.2 “” 容 灾 指 标 


(1) RTO 

恢复 时 间 目 标 (recovery time objectives, RTO) 是 指 从 业务 中 断 到 业务 恢复 正常 运 
营 之 间 的 时 间 间 隔 。 它 是 反映 业务 恢复 及 时 性 的 指标 。RTO 值 越 小 ， 容 灾 系 统 的 数据 恢 
复 能 力 越 强 。 例 如 ,一 个 5 分钟 的 RTO 表明 所 有 业务 需要 在 5 分 钟 之 内 恢复 ， 并且 系 统 
能 够 正常 运作 ; 没有 停顿 的 业务 恢复 CBN 0 小 时 的 RTO) 表明 没有 任何 延迟 地 恢复 业务 ， 
并 且 能 够 重新 正常 运营 。RTO 示意 图 如 图 12-1 所 示 。 


灾难 发 生 恢复 运行 
业务 中 断 | ee 
RTO 
图 12-1 RTO 示意 图 


(2) RPO 

恢复 点 目标 (recovery point objectives, RPO) 是 指 当 灾难 发 生 时 ， 人 允许 数据 丢失 的 
最 长 时 间 间 隔 。 例 如 ， 昨 天 晚上 23:00 进行 了 数据 同步 ， 那 么 RPO 即 业务 能 够 恢复 到 的 
时 间 点 就 是 昨天 的 23:00。 它 是 反映 数据 恢复 完整 性 的 指标 。 

一 个 5 分 钟 的 RPO 表明 必须 每 隔 5 分 钟 进行 一 次 业务 及 系统 数据 同步 ,一 个 1 小 时 
的 RPO 表明 这 种 业务 及 系统 数据 只 需要 1 小 时 同步 一 次 。 当 RPO 数值 较 大 时 ， 间 隔 时 
间 较 久 才 同 步 一 次 数据 ， 这 段 较 长 时 间 内 ， 需 要 同步 的 数据 可 能 已 经 丢失 而 无 法 恢复 ; 
反之 ， 当 RPO 数值 较 小 时 ， 因 为 数据 被 及 时 地 备份 、 复 制 或 记录 ， 丢 失 的 数据 很 少 。 但 
越 小 的 RPO 意味 着 付出 更 多 的 费用 。 所 以 ， 在 付 出 更 多 的 费用 和 更 少 的 数据 丢失 量 之 间 ， 
必须 做 出 权衡 。PRO 示意 图 如 图 12-2 所 示 。 


最 后 有 效 数据 备份 时 间 点 JOERA 
| I Wai 
数据 丢失 
RPO 


12-2 RPO 示意 图 
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12.2.3 ” 容 灾 级 别 


根据 SHARE 78 国际 组 织 提出 的 标准 ， 灾 难 恢复 解决 方案 可 分 为 7 级 ， 即 从 低 到 高 
有 7 种 不 同 层次 的 灾难 恢复 解决 方案 。 可 以 根据 企业 数据 的 重要 性 以 及 业务 所 需 恢复 的 
速度 和 程度 来 设计 选择 并 实现 业务 的 灾难 恢复 计划 。 这 7 个 层次 分 别 如 下 。 

(1) Tier 1 一 一 PTAM 卡车 运送 访问 方式 (Pickup Truck Access Method ) 

Tier] 的 灾难 恢复 方案 必须 设计 一 个 应 急 方 案 , 能 够 备份 所 需 的 信息 并 将 它 存储 在 异 
地 ， 然 后 根据 恢复 的 具体 需求 ， 有 选择 地 建立 备份 平台 ， 但 不 提供 数据 处 理 的 硬件 。 

PTAM 是 一 种 应 用 于 许多 中 心 的 备份 的 标准 方式 ， 数 据 在 完成 写 入 之 后 ， 将 会 被 送 
到 远离 本 地 的 地 方 ， 同 时 准备 有 数据 恢复 的 程序 。 在 灾难 发 生 后 ， 需 要 重新 安装 整套 系 
统 ， 系 统 和 数据 可 以 恢复 并 重新 与 网 络 相 连 。 这 种 灾难 恢复 方案 相对 来 说 成 本 较 低 〈 仅 
仅 需 要 消耗 传输 工具 和 存储 设备 ) 。 但 同时 有 难于 管理 的 问题 ， 即 很 难 知道 什么 样 的 数 
据 在 什么 地 方 。 

(2) Tier 2 一 一 PTAM 卡车 运送 访问 方式 + 热 备份 中 心 (PTAM + Hot 中 心 ) 

Tier 2 相当 于 Tier] 再 加 上 热 备 份 中 心 能 力 的 灾难 恢复 。 热 备份 中 心 拥有 足够 的 硬件 
和 网 络 设备 去 支持 关键 应 用 的 安装 需求 ， 这 样 的 应 用 是 十 分 关键 的 ， 它 必须 在 灾难 发 生 
的 同时 ， 在 异地 有 正 运行 的 硬件 提供 支持 。 这 种 灾难 恢复 的 方式 依赖 于 PTAM 方法 将 日 
常数 据 放 入 仓库 ， 当 灾难 发 生 时 ， 数 据 被 移动 到 一 个 热 备 份 的 中 心 。 虽 然 移 动 数据 到 一 
个 热 备份 中 心 增加 了 成 本 ， 但 明显 降低 了 灾难 恢复 时 间 。 

(3) Tier 3 一 一 电子 链接 (Electronic Vaulting) 

Tier 3 是 在 Tier 2 的 基础 上 用 电子 链 路 取代 卡车 进行 数据 传送 的 灾难 恢复 。 在 灾难 
发 生 后 , 通过 电子 链 路 传送 存储 的 数据 用 于 灾难 恢复 。 由 于 热 备份 中 心 要 保持 持续 运行 ， 
所 以 增加 了 设备 采购 和 运营 成 本 ， 但 通过 电子 链 路 方式 传送 数据 大 大 提高 了 灾难 恢复 的 
速度 。 

(4) Tier 4 一 一 活动 状态 的 备份 中 心 (Active Secondary 中 心 ) 

Tier 4 灾难 恢复 具有 两 个 中 心 同时 处 于 活动 状态 并 管理 彼此 的 备份 数据 ， 人 允许 备份 
行动 在 任何 一 个 方 同 发 生 。 接 收 方 硬件 必须 保证 与 男 一 方 平台 物理 地 分 离 ， 在 这 种 情况 
下 ， 工 作 负 载 可 能 在 两 个 中 心 之 间 分 享 ， 中 心 1 成 为 中 心 2 的 备份 ， 反 之 亦 然 。 在 两 个 
中 心 之 间 ， 彼 此 的 在 线 关 键 数 据 的 拷贝 不 停 地 相互 传送 着 。 在 灾难 发 生 时 ， 需 要 的 关键 
数据 通过 网 络 可 迅速 恢复 , 通过 网 络 的 切换 , 关键 应 用 的 恢复 也 可 降低 到 小 时 级 或 分 钟 级 。 

(5) Tier 5 一 一 两 中 心 两 阶段 确认 

Tier 5 在 Tier 4 的 基础 上 管理 被 选择 的 数据 (根据 单一 commit 的 范围 ， 在 本 地 和 远 
程 数 据 库 中 同时 更 新 数据 ) ， 也 就 是 说 ， 在 更 新 请 求 被 认为 满意 之 前 ，Tier 5 需要 生产 
中 心 与 备份 中 心 的 数据 都 被 更 新 。 我 们 可 以 想象 这 样 一 种 情景 ， 数 据 在 两 个 中 心 之 间 相 
互 映 象 ， 由 远程 two-phasecommit 来 同步 。Tier 5 为 关键 应 用 使 用 了 双重 在 线 存 储 ， 在 灾 
难 发 生 时 ， 只 有 传送 中 的 数据 丢失 ， 恢 复 时 间 降 低 到 分 钟 级 。 

(6) Tier 6 一 一 0 数据 丢失 (Zero Data Loss) 

Tier 6 可 以 实现 0 数据 丢失 率 ， 并 保证 数据 立即 自动 传输 到 恢复 中 心 。Tier 6 被 认为 
是 灾难 恢复 的 最 高 级 别 ， 在 本 地 和 远程 的 所 有 数据 更 新 的 同时 ， 利 用 了 双重 在 线 存 储 和 
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完全 的 网 络 切换 能 力 。Tier 6 是 灾难 恢复 中 最 昂贵 的 方式 ， 但 也 是 速度 最 快 的 恢复 方式 。 

(7) Tier 7 一 一 0 数据 丢失 ， 动 系统 故障 切换 

第 7 层 和 第 6 层 实现 之 间 的 区 别 是 ， 当 一 个 工作 中 心 发 生 灾 难 时 ， 第 7 层 实 现 能 够 
提供 一 定 程度 的 跨 站 点 动态 负载 平衡 和 上 自动 系统 故障 切换 功能 。 现 在 已 经 证 明 ， 为 实现 
有 效 的 灾难 恢复 ， 无 需 人 工 介 入 的 自动 站 点 故障 切换 功能 是 需要 被 纳入 考虑 范围 的 重要 
事项 。 

中 国 容 灾 与 备份 的 行业 标准 《信息 系统 灾难 恢复 规范 》 也 对 灾难 的 恢复 能 力作 了 等 
级 划分 ( 共 6 级 )。 它 规定 了 信息 系统 灾难 恢复 应 遵循 的 基本 要 求 , 适用 于 信息 系统 灾难 
恢复 的 规划 、 审 批 、 实 施 和 管理 。 

《规范 》 对 灾难 恢复 行业 相应 的 术语 和 定义 、 灾 难 恢复 概述 、 灾 难 恢复 需求 的 确定 、 
灾难 恢复 策略 的 制定 和 灾难 恢复 策略 的 实现 等 内 容 作 了 有 具体 描述 。 

以 下 是 《信息 系统 灾难 恢复 规范 》 对 灾难 恢复 能 力 的 等 级 划分 。 

O 第 1 级 基本 支持 。 

D 第 2 级 备用 场地 支持 。 

© 第 3 级 电子 传输 和 部 分 设备 文 持 。 

O 第 4 级 电子 传输 及 完整 设备 支持 。 

© 第 5 级 实时 数据 传输 及 完整 设备 支持 。 

© 第 6 级 数据 零 丢 失 和 远程 集群 支持 。 

对 于 不 同 的 容 灾 等 级 , 《规范 》 都 对 其 RTO 与 RPO 进行 了 明确 的 定义 ， 如 表 12-1 
所 示 。 


表 12-1 灾难 恢复 等 级 的 RTO 和 RPO 的 定义 
1 R 
2 24 小 时 以 后 1 一 7 天 
3 12 小 时 以 上 数 小 时 至 1 天 
4 数 小 时 至 2 天 数 小 时 至 1 天 
5 数 分钟 至 2 天 0 一 30 分 钟 
6 0 
12.3 快照 技术 


容 灾 离 不 开 备 份 。 常 见 的 容 灾 技 术 包括 快照 技术 、 镜 像 技术 、 复 制 技术 。 本 节 主 要 
介绍 快照 技术 ， 在 12.4 节 将 着 重 介绍 镜像 技术 ，12.5 节 主 要 介绍 复制 技术 。 


12.3.1 快照 技术 简介 


在 现实 生活 中 ， 只 要 轻 轻 按 下 照相 机 的 快门 ， 就 能 把 景物 或 人 像 留 在 相册 里 。 在 计 
算 机 中 ， 我 们 也 希望 通过 快速 拍照 来 进行 记录 与 保存 。 但 在 计算 机 中 ， 我 们 需要 保存 的 
是 数据 ， 人 快照 技术 就 是 把 数据 在 菜 一 时 刻 的 映像 保留 下 来 ， 作 为 增强 容 灾 系统 的 一 种 技 
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线 存储 设备 防范 数据 丢失 的 有 效 方法 之 一 。 越 来 越 多 的 存储 设备 支持 快照 功能 。 
(拷贝 开始 的 时 间 点 ) 的 映像 。 快 照 可 以 是 数据 再 现 的 

。 快照 可 迅速 生成 ， 并 可 用 作 传统 备份 和 归档 的 各 

。 基于 磁盘 的 快照 使 存储 设备 有 灵活 和 频繁 的 恢复 点 , 可 以 快速 通过 不 同时 间 点 的 
变 时 ， 访 指针 列表 能 够 在 极 短 时 间 内 提供 一 个 实时 数据 ， 并 进行 复制 。 

1. 写 前 拷贝 快照 (copy-on-write, COW ) 
针 被 拷贝 。 使 用 这 项 技术 当 已 经 有 了 快照 时 ， 如 果 有 人 试图 改写 原始 LUN 上 的 数据 ， 
或 者 当 引 用 快照 时 ， 将 指针 映射 到 老 位 置 。 因 此 写 前 拷贝 快照 通常 也 称 为 指针 型 快照。 


术 。 同 时 ， 随 着 存储 应 用 需求 的 提高 ， 用 户 也 需要 通过 在 线 方 式 保 护 数 据 ， 快 照 就 是 在 

存储 网 络 行业 协会 (SNIA) 对 快照 (snapshot) 的 定义 是 : 关于 指定 数据 集合 的 一 
个 完全 可 用 拷贝 ， 该 拷贝 包括 相应 数据 在 某 个 时 间 点 | 
一 个 复 本 如 图 12-3 所 示 。 = 

快照 技术 有 如 下 特点 。 

数据 源 ， 缩 小 甚至 消除 了 数据 备份 的 窗口 。 Peg RR 
e 快照 存储 在 磁盘 上 ， 可 以 快速 直接 存 取 ， 提 高 了 数据 恢复 的 速度 。 
快照 简易 恢复 意外 擦 除 或 损坏 的 数据 ， 对 其 进行 在 线 数据 恢复 。 

从 具体 的 技术 细节 来 讲 ， 快 照 建立 一 个 指针 列表 ， 指 示 读 取 数 据 的 地 址 ， 当 数据 改 
12.3.2 ”常见 的 快照 技术 

存储 快照 有 两 种 模式 : 写 前 拷贝 (copy-on-write) 快照 和 分 割 镜像 快照 。 

写 前 拷贝 快照 是 表现 数据 外 观 特征 的 “照片 ”。 这 种 方式 通常 也 被 称 为 “元 数据 ” 
拷贝 ， 即 所 有 的 数据 并 没有 被 真正 拷贝 到 另 一 个 位 置 ， 只 是 指示 数据 实际 所 处 位 置 的 指 
快照 软件 首先 将 原始 的 数据 块 拷贝 到 一 个 新 位 置 〈 专 用 于 快照 操作 的 存储 资源 池 ) ， 然 
后 进行 写 操作 ， 如 图 12-4 所 示 。 之 后 引用 原始 数据 时 ， 人 快照 软件 将 指针 映射 到 新 位 置 ， 
它 的 优点 是 占用 空间 小 ， 对 系统 性 能 的 影响 较 小 ;缺点 是 如 果 原 数据 盘 在 没有 备份 的 情 
况 下 发 生 不 可 恢复 性 损坏 ， 数 据 就 无 法 恢复 了 。 





K 12-4 写 前 拷贝 过 程 示 意图 
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写 前 拷贝 快照 在 每 次 输入 新 数据 或 已 有 数据 被 更 新 时 ， 改 动 存储 数据 。 这 样 可 以 在 
发 生硬 盘 写 错误 、 文 件 损坏 或 程序 故障 时 迅速 恢复 数据 。 但 是 ， 如 果 需 要 对 存储 媒介 上 
的 所 有 数据 进行 完全 的 存档 或 恢复 ， 则 所 有 以 前 的 快照 都 必须 可 供 使 用 。 

2. 分 割 镜像 快照 

分 割 镜像 快照 也 被 称 为 镜像 型 快照 或 原样 复制 快照 。 它 相当 于 当时 数据 的 全 镜像 ， 
因为 需要 占用 到 与 原 数 据 相等 容量 的 空间 ， 所 以 这 种 类 型 的 快照 会 对 系统 性 造成 一 定 的 
负荷 ， 而 且 缺 乏 灵活 性 ， 无 法 在 任意 时 间 点 为 任意 数据 卷 创 建 快 照 。 其 优点 是 ， 即 使 原 
数据 损坏 ， 它 也 不 会 受到 太 大 的 影响 。 

它 的 工作 原理 是 : 每 次 应 用 运行 时 ， 都 生成 整个 卷 的 快照 ， 而 不 只 是 新 数据 或 更 新 
数据 的 备份 。 这 种 快照 方式 使 离线 访问 数据 成 为 可 能 , 并 且 简 化 了 恢复 .复制 或 存档 LUN 
上 的 所 有 数据 的 过 程 。 但 是 ， 这 个 过 程 较 慢 、 占 用 空间 较 大 。 

这 两 种 快照 技术 的 优 缺点 对 比如 表 12-2 所 示 。 


表 12-2 3 2 快照 方式 优 缺 点 对 比 | 

















写 前 拷贝 快照 是 表现 数 
据 外 观 特征 的 “照片 ”。 
所 有 的 数据 并 没有 被 真 
是 指示 数据 实际 所 处 位 
置 的 指针 被 拷贝 


如 果 原 数据 盘 在 没有 
备份 的 情况 下 发 生 不 
可 恢复 性 损坏 ， 数 据 
就 无 法 恢复 了 






写 前 拷贝 快照 
(指针 型 快照 》 


占用 空间 小 ， 对 系统 性 能 的 
影响 较 小 















这 种 类 型 的 快照 会 
对 系统 性 能 造成 一 
EKRE, MERZ 
灵活 性 , 无 法 在 任意 
时 间 点 为 任意 数据 
卷 快照 


即使 原 数 据 损坏 ， 它 也 不 会 
受到 太 大 的 影响 ， 使 离线 访 
问 数据 成 为 可 能 ， 并 且 简化 
了 恢复 、 复 制 或 存档 LUN 上 
所 有 数据 的 过 程 










每 次 应 用 运行 时 ,都 生成 
整个 卷 的 拷贝 , 而 不 只 是 
新 数据 或 更 新 的 数据 。 相 
当 于 当时 数据 的 全 镜像 


分 割 镜像 快照 ( 镜 
像 型 快照 或 原样 
复制 型 快照 》 


12.3.3 ”快照 技术 的 应 用 


现在 ， 快 照 技术 已 经 超越 了 简单 的 数据 保护 范畴 。 可 以 用 快照 进行 高 效 且 无 风 
险 的 应 用 软件 测试 。 用 快照 数据 做 测试 ， 不 会 对 生产 数据 造成 任何 的 破坏 。 例 如 ， 对 
于 数据 挖掘 和 电子 发 现 应 用 ， 快 照 就 是 理想 的 测试 数据 源 。 在 灾难 恢复 方面 ， 快 照 是 
一 种 非常 有 效 的 方法 ， 甚 至 是 首选 ， 非 常 适合 遭 到 恶意 软件 攻击 、 人 为 误 操 作 和 数据 
损坏 等 有 还 辑 错误 发 生 时 的 数据 恢复 。 过 去 我 们 认为 只 有 磁盘 阵列 具备 快照 功能 ， 但 
事实 上 磁盘 阵列 只 是 其 中 之 一 而 已 。 广 义 的 快照 技术 通常 可 有 7 个 不 同类 型 的 实现 
主体 。 

1. 基于 文件 系统 的 快照 

很 多 文件 系统 都 支持 快照 功能 ， 而 且 使 用 起 来 非常 简单 。 通 常情 况 下 ， 需 要 管理 的 
服务 器 和 文件 系统 越 多 ， 快 照 结构 的 复杂 程度 就 越 高 。 

2. 基于 远 辑 卷 管理 器 (logic volume manager, LVM) 的 快照 

带 有 快照 功能 的 逻辑 卷 管理 器 很 多 ， 而 且 有 的 LVM 快照 功能 还 可 以 跨 多 个 文件 系 
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统 实现 。 像 基于 文件 系统 的 快照 一 样 ，LVM 上 的 快照 应 用 也 需要 面 对 系 统 之 间 的 协调 问 
题 和 复杂 的 技术 实施 问题 。 

3. 基于 网 络 附 加 存储 系统 (network access server, NAS) 的 快照 

NAS 本 质 上 就 是 一 个 经 过 优化 的 或 是 专门 定制 的 文件 系统 ， 运 行 在 特定 的 设备 上 ， 
或 集成 在 存储 设备 中 。 大 多 数 中 端 和 企业 级 NAS 系统 都 提供 快照 功能 。 通过 网 络 连接 到 
NAS 的 计算 机 系统 都 可 以 使 用 这 种 标准 的 通用 快照 ， 包 括 物理 服务 器 、 虚 拟 机 、 人 台式 机 
和 笔记 本 电脑 ， 它 也 非常 容易 操作 和 管理 。 

4. 基于 磁盘 阵列 的 快照 

大 多 数 磁 盘 阵 列 的 软件 系统 都 含有 快照 功能 。 基 于 磁盘 阵列 的 快照 与 基于 NAS 的 
快照 有 非常 相似 的 优点 ， 所 有 与 磁盘 阵列 相连 的 计算 机 系统 都 可 以 使 用 这 种 标准 的 通用 
快照 功能 ， 包 括 物理 服务 器 、 虚 拟 机 、 人 台式 机 和 笔记 本 电脑 等 。 快 照 的 实施 、 操 作 和 管 
理 也 都 很 简单 。 像 NAS 一 样 ， 很 多 磁盘 阵列 的 快照 功能 也 可 以 被 Windows VSS (Visual 
Source Safe)、 备 份 服务 器 和 备份 Agent 等 软件 直接 调用 。 

5. 基于 存储 虚拟 化 设备 的 快照 

磁盘 阵列 和 NAS 快照 具备 的 优点 在 存储 虚拟 化 设备 上 同样 能 够 体现 ， 而 且 某 些 方 
面 还 能 做 得 更 好 。 可 以 将 来 自 不 同 厂商 的 很 多 存储 设备 聚集 在 少量 的 几 个 控制 点 或 单一 
控制 点 上 管理 ， 提 供 通 用 的 标准 化 快照 ， 最 大 程度 地 简化 了 快照 的 管理 操作 成 本 和 学 习 
成 本 。 

6. 基于 主机 虚拟 化 软件 的 快照 

随 着 服务 器 虚拟 化 应 用 的 普及 ， 基 于 主机 虚拟 化 管理 软件 (hypervisor) 的 快照 技术 
也 逐渐 流行 起 来 。 在 主机 虚拟 化 软件 层 实 现 快照 的 优点 是 简单 直接 。 由 于 同 虚拟 机 管理 
软件 绑 定 在 一 起 , 因此 可 以 为 所 有 的 虚拟 机 提供 统一 的 快照 。 相 对 于 其 他 类 型 快照 而 言 ， 
基于 虚拟 机 的 快照 很 容易 部 署 、 使 用 和 管理 。 

7. 基于 数据 库 的 快照 

在 数据 库 中 ， 快 照 动作 被 称 为 “快照 隔离 ”在 一 般 情况 下 ， 数 据 库 备 份 工 具 会 利 
用 快照 隔离 的 功能 来 恢复 裔 溃 〈 出 现 一 致 性 问题 ) 的 数据 表 。 针 对 数据 库 内 部 数据 和 基 
于 该 数据 库 的 相关 应 用 ， 使 用 数据 库 目 带 的 快照 比较 有 效 。 但 是 ， 数 据 库 快 照 的 重要 缺 
陷 就 是 覆盖 的 范围 非常 有 限 ， 其 作用 仅 限 于 特定 的 数据 库 内 部 和 数据 库 相 关 的 应 用 ， 无 
法 管理 在 同一 台 服 务 器 上 的 文件 系统 、 文 件 类 应 用 或 其 他 数据 库 ， 更 不 用 说 管理 其 他 的 
服务 器 了 。 有 时 候 不 得 不 通过 其 他 层次 的 快照 技术 来 解决 数据 库 之 外 的 数据 保护 问题 ， 
这 样 ， 操 作 和 管理 将 变 得 有 些 复杂 。 


12.3.4 ”华为 产品 中 快照 技术 的 应 用 


华为 产品 中 的 N8500 集群 NAS 存储 系统 采用 了 快照 技术 。 该 存储 系统 的 文件 系统 
快照 支持 生成 源 文件 系统 在 某 个 时 间 点 上 的 一 致 性 映像 ， 在 不 中 断 正常 业务 的 前 提 下 ， 
快速 得 到 一 份 与 源 文件 系统 一 致 的 数据 副本 。 副 本 生成 之 后 立即 可 用 ， 并 且 对 副本 的 读 
写 操作 不 再 影响 源 文件 系统 中 的 数据 。 因 此 通过 文件 系统 快照 技术 可 以 解决 在 线 备 份 、 
数据 分 析 、 应 用 测试 等 难题 。 用 户 可 以 通过 多 种 方法 使 用 存储 检查 点 。 例 如 ， 它 们 可 
用 于 : 
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© 创建 可 以 备份 到 磁带 的 文件 系统 的 稳定 映像 。 

© 提供 源 文件 系统 的 磁盘 备份 ， 在 意外 删除 情况 下 ,最终 用 户 可 以 恢复 上 自己 的 

文件 。 

。 在 安装 修补 程序 之 前 , 创建 应 用 程序 的 二 进 制 副 本 ,以 允许 出 现 问题 时 进行 

还 原 。 

。 创建 文件 系统 的 磁盘 备份 ,可 用 作 传 统 的 基于 磁带 备份 的 补充 ， 从 而 提供 更 快 的 

备份 和 恢复 功能 。 

N8500 的 文件 系统 快照 采用 了 写 前 拷贝 (copy-on-write) 技术 方式 实现 。 它 为 用 户 
提供 读 写 业务 ， 用 户 可 通过 创建 快照 方便 地 重 定义 数据 用 途 ， 实 现 测 试 、 备 份 、 归 档 等 
各 类 操作 。 对 快照 的 修改 操作 需要 说 明 的 是 ， 如 果 对 某 一 快照 执行 了 写 操作 ， 那 么 该 快 
照 将 不 再 是 快照 创建 时 间 点 的 一 致 性 映像 ， 因 此 将 不 能 恢复 到 创建 时 间 点 的 文件 系统 数 
据 状态 。 

N8500 文件 系统 中 的 快照 技术 具有 以 下 特点 。 

1. 快速 数据 恢复 

对 于 传统 的 离线 备份 ， 备 份 数 据 无 法 直接 在 线 读 取 ， 必 须 经 过 较 长 时 间 的 数据 恢复 
过 程 ， 才 能 够 获得 原 数据 在 备份 时 间 点 的 可 用 副本 ， 从 而 实现 数据 的 还 原 。N8500 的 文 
件 系统 快照 可 以 直接 从 快照 中 恢复 出 快照 时 间 点 的 数据 ， 实 现 了 方便 地 数据 恢复 。 

2. 循环 定时 快照 ， 实 现 持 续 数 据 保护 

N8500 对 同一 文件 系统 支持 多 个 时 间 点 的 快照 ， 用 户 可 以 定制 策略 定时 自动 创建 快 
照 。 当 多 个 时 间 点 的 快照 采用 循环 的 方式 沿 时 间 轴 向 前 推进 自动 操作 时 ， 非 常 方便 且 低 
成 本 地 实现 了 持续 数据 保护 。 

3. 快照 对 性 能 的 影响 

在 文件 系统 中 使 用 快照 并 非 对 系统 性 能 没有 影响 。 在 文件 系统 中 创建 快照 后 ， 读 操 
作 的 性 能 不 会 受到 影响 ， 但 却 增 加 了 写 操作 的 复杂 度 。 当 原文 件 系统 数据 更 新 较 大 时 ， 
写 操作 增加 ， 系 统 性 能 有 一 定 的 降低 。 


12.4 ”镜像 技术 


12.4.1 ”镜像 技术 简介 


镜像 是 在 两 个 或 多 个 磁盘 或 磁盘 子 系统 上 产生 同一 个 在 线 数据 拷贝 的 信息 存储 过 
程 ， 其 产生 多 个 数据 镜像 系统 。 以 两 个 镜像 磁盘 为 例 ， 一 个 叫 主 镜像 系统 ， 为 一 个 叫 从 
镜像 系统 ， 当 两 个 磁盘 都 正常 工作 时 ， 数 据 可 以 从 任 一 磁盘 读 取 ， 如 果 一 个 磁盘 失效 ， 
则 可 以 从 另外 一 个 正常 工作 的 磁盘 读 出 数据 。 

数据 镜像 技术 按照 主 从 镜像 存储 系统 所 处 的 位 置 可 分 为 本 地 镜像 和 远程 镜像 。 

在 本 地 镜像 模式 下 ， 由 最 少 两 个 相同 容量 的 磁盘 子 系统 组 成 。 磁 盘子 系统 处 于 不 同 
的 磁盘 驱动 器 上 。 每 次 磁盘 子 系统 的 写 操作 将 同时 对 所 有 镜像 进行 。 读 操作 则 根据 特定 
算法 选择 茶 镜像 来 提供 服务 。 
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远程 镜像 技术 又 叫 远程 复制 ， 用 于 备份 主 数 据 中 心 和 备 援 中 心 之 间 的 数据 。 它 是 容 
灾 备 份 的 核心 技术 ， 同 时 也 是 保持 远程 数据 同步 和 实现 灾难 恢复 的 基础 。 在 远程 镜像 模 
式 下 ， 镜 像 磁 盘 与 数据 源 不 在 同一 地 点 ， 镜 像 操 作 通 过 协作 人 处理 器 完成 。 协 作 处 理 器 是 
控制 异地 镜像 拷贝 的 处 理 器 ， 源 处 理 器 是 控制 数据 源 拷贝 的 处 理 器 。 协 作 处 理 器 由 数据 
源 处 理 器 控制 ， 即 协作 处 理 器 服从 来 自 源 处 理 器 的 命令 。 远 程 镜像 根据 采用 的 “ 写 ” 协 
议 不 同 ， 可 划分 为 同步 远程 镜像 和 异步 远程 镜像 两 种 方式 。 

。 同步 远程 镜像 (同步 复制 技术 ) 是 指 通过 远程 镜像 软件 ， 将 本 地 数据 以 完全 
同步 的 方式 复制 到 异地 ， 每 一 本 地 的 IO 事务 均 需 等 竺 远程 复制 的 完成 确认 信息 ， 方 
予以 释放 ， 在 这 种 情况 下 ，“ 写 ”操作 会 同时 在 原始 磁盘 和 镜像 磁盘 上 完成 。 同 步 镜 
像 的 优点 是 : 使 拷贝 总 能 与 本 地 机 要 求 复 制 的 内 容 相 匹配 。 当 主 站 点 出 现 故 障 时 ， 用 
户 的 应 用 程序 切换 到 备份 的 替代 站 点 后 ， 被 镜像 的 远程 副本 可 以 保证 业务 继续 执行 ， 
而 没有 数据 丢失 。 但 它 存在 往返 传播 造成 延 时 较 长 的 缺点 ， 只 限于 在 相对 较 近 的 距离 
上 应 用 。 

。 异步 远程 镜像 (异步 复制 技术 ) 保证 在 更 新 远程 存储 视图 前 完成 加 本 地 存储 系统 
的 基本 操作 ， 由 本 地 存储 系统 提供 给 镜像 主机 VO 操作 ， 并 完成 确认 信息 。 远 程 的 数据 
复制 是 以 后 台 同 步 的 方式 进行 的 ， 这 使 本 地 系统 性 能 受到 的 影响 很 小 ， 传 输 距 离 长 〈 可 
达 1000km LAE) ， 对 网 络 带 宽 要 求 小 。 


12.4.2 ”镜像 技术 的 应 用 


一 般 来 说 ， 镜 像 是 在 人 硬件 架构 的 基础 上 由 软件 实现 的 ， 通 常 可 在 系统 的 3 个 位 置 上 
实现 。 

L. FEZ 

卷 管理 器 作为 服务 器 的 软件 组 件 ， 它 是 在 文件 系统 和 主机 总 线 适配器 驱动 程序 之 间 
构架 的 单独 一 层 ， 其 主要 目的 是 把 服务 器 挂 载 的 物理 磁盘 驱动 器 虚拟 化 ， 以 更 方便 的 形 
式 提 供给 文件 系统 使 用 。 

2. 磁盘 控制 器 

磁盘 控制 器 除了 完成 数据 块 的 移动 、 拷 贝 、 计 算 等 特殊 功能 外 ， 还 带 有 功能 强 
大 的 通用 处 理 器 ， 磁 盘 控制 器 是 一 些 较 大 型 服务 器 实现 数据 镜像 和 RAID 最 为 常用 的 
位 置 。 

3. 主机 总 线 适 配器 

一 些 供应 商 开 发 了 一 种 既 可 以 提供 传统 主机 总 线 适 配器 的 格式 转换 功能 ， 又 能 实现 
多 IO 总 线 接口 以 及 RAID 和 数据 镜像 算法 的 主机 总 线 适 配器 。 这 种 主机 总 线 适 配器 有 具 
有 很 高 的 性 价 比 ， 已 经 普遍 应 用 在 小 型 部 门 服务 器 上 上 ， 但 由 于 这 种 主机 总 线 适 配器 难以 
实现 多 主机 的 数据 存 取 ， 所 以 它们 在 企业 服务 器 上 的 用 途 有 限 。 

4. 镜像 技术 在 华为 产品 中 的 应 用 

华为 产品 OceanStor V3. 系列 采用 了 镜像 技术 。OceanStor V3. 系列 同时 支持 文件 系 
统 和 块 数据 远程 复制 ， 根 据 用 户 的 实际 需求 ， 选 择 不 同 的 异地 容 灾 方式 。OceanStor V3. 
系列 存储 系统 的 远程 复制 分 为 同步 远程 复制 (hyper mirror/S) 和 异步 远程 复制 (hyper 
mirror/A) 两 种 主流 的 远程 复制 技术 。OceanStor V3. 系列 存储 系统 也 采用 了 分 裂 镜像 技 
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术 。 其 分 裂 镜像 名 为 HyperClone， 其 主要 功能 是 在 不 中 断 业 务 的 前 提 下 ， 为 存储 系统 
的 LUN 建立 一 份 某 时 刻 的 完整 物理 拷贝 ， 并 且 在 分 裂 后 ， 对 物理 拷贝 的 读 写 操作 不 会 
影响 原 LUN 上 的 数据 。 因 此 通过 分 裂 镜像 技术 可 以 解决 在 线 备 份 、 数 据 挖 据 、 应 用 测 
试 等 难题 。 


12.5 ”复制 技术 


12.5.1 复制 技术 简介 


复制 技术 是 容 灾 方案 中 的 关键 技术 之 一 。 

复制 是 指 将 主机 产生 的 业务 数据 写 入 从 端 存储 系统 的 从 逻辑 单元 号 (logical unit 
number，LUN) 中 ， 以 实现 数据 的 容 灾 备 份 。 远 程 复制 是 容 灾 备份 的 核心 技术 ， 可 以 实 
现 远程 数据 同步 和 灾难 恢复 。 在 物理 位 置 上 分 离 的 存储 系统 ， 通 过 远程 数据 连接 功能 ， 
可 以 在 远程 维护 一 套 或 多 套数 据 副 本 。 一 旦 灾难 发 生 ， 分 布 在 异地 存储 系统 上 的 备份 数 
据 并 不 会 波及 ， 从 而 实现 容 灾 备份 功能 。 

容 灾 数 据 复制 技术 的 目的 和 受益 如 表 12-3 所 示 。 


表 12-3 容 灾 数据 复制 技术 的 目的 和 受益 


fi 业务 数据 失效 后 ， 可 以 通过 远 端 的 备份 数 | 避免 主 站 点 数据 失效 后 , 由 于 数据 
MA | 据 进行 恢复 丢失 给 客户 造成 的 损失 


灾难 发 生 时 ， 可 以 通过 从 站 点 快速 接管 主 | 避免 主 站 点 故障 后 , 由 于 业务 中 断 








保持 业务 的 不 同 断 | 站 点 的 业务 数据 ， 保 证 业务 的 持续 性 给 客户 造成 的 损失 
aie 避免 灾难 发 生 后 , 由 于 业务 数据 丢 
主 站 点 的 数据 ars 


上 面 描述 中 ， 主 站 点 、 从 站 点 、 主 机 的 含义 如 下 。 

© 主 站 点 是 指 由 主 端 存储 系统 、 应 用 服务 器 、 链 路 等 构成 的 生产 中 心 。 
。 从 站 点 是 指 由 从 端 存储 系统 、 应 用 服务 器 、 链 路 等 构成 的 备份 中 心 。 
。 如 果 没有 特殊 说 明 ， 本 节 中 的 主机 特 指 应 用 服务 器 


完整 的 容 灾 解 决 方案 至 少 应 包括 两 个 部 分 : 数据 复制 和 系统 切换 。 从 表 12-2 可 以 
看 出 ,数据 复制 的 作用 是 保证 主 备 中 心 两 地 数据 的 有 效 性 和 一 致 性 ， 是 容 灾 建设 的 
基础 。 

复制 技术 与 上 节 提 到 的 镜像 技术 是 有 本 质 区 别 的 。 在 镜像 技术 中 ， 数 据 与 其 镜像 的 
内 容 上 自始至终 都 保持 完全 一 致 ， 也 就 是 说 两 边 的 数据 是 完全 同步 的 。 而 在 复制 技术 中 ， 
两 边 的 数据 只 在 复制 的 那 一 刻 是 完全 相同 的 ， 之 后 改变 其 中 一 边 的 数据 ， 都 不 会 影响 到 
男 一 边 的 数据 ， 此 时 两 边 的 数据 并 不 同步 。 

目前 主要 的 数据 复制 技术 有 磁带 备份 、 基 于 智能 存储 系统 的 磁盘 数据 复制 技术 、 数 
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据 库 数据 复制 技术 、 基 于 应 用 的 数据 复制 技术 和 基于 逻辑 卷 的 数据 复制 技术 等 。 这 几 种 
复制 技术 的 比较 如 表 12-4 所 示 。 


表 12-4 复制 技术 比较 















数据 库 的 异地 复制 


































数据 的 复制 过 程 通 es 通过 操作 系统 或 | 技术 通常 采用 日 志 
kamm | 过 本 地 的 存储 系统 | eee eee are | 者 数据 郑 管 理 器 | 复制 功能 ， 依 靠 本 地 
UE | AER | pare | 来 实现 对 数据 的 | 和 远程 主机 间 的 日 
之 间 的 通信 完成 远程 复制 志 归 档 与 传递 来 实 
现 两 端的 数据 一 至 
与 平台 无 关 , 需要 增 
taut ER 加 专 有 的 复制 服务 | 同 构 主机 、 异 构 PEE 





器 或 带 有 复制 功能 
的 SAN 交换 机 


IBM PPRC、EMC | UITSVM. EMC 

| S 
Een SRDF, HP CA, 4 | VSM, 4:4 VIS oe 
w 为 Hyper mirror 等 66000T 等 


存储 


Oracle DataGuard、 
DNT IDR 等 


12.5.2 ”复制 技术 的 应 用 


随 着 应 用 系统 的 不 断 发 展 ， 系 统 对 数据 库 的 依赖 与 日 俱 增 ， 目 前 无 论 是 金融 、 政 府 、 
石化 、 电 力 、 教 育 、 医 疗 ， 还 是 企业 ERP 系统 ， 无 一 例外 地 出 现 了 数据 库 ， 特 别 是 大 型 
数据 库 的 身影 ， 主 要 集中 在 Oracle. SQL Server 和 DB2， 目 前 应 用 系统 都 需要 通过 数据 
库 来 保证 交易 的 完整 性 以 及 交易 完成 的 效率 。 但 是 很 多 中 小 企业 不 可 能 使 用 大 型 集中 数 
据 库 的 方式 ， 只 能 通过 数据 复制 技术 ,利用 廉价 VPN 技术 ,使 用 简单 宽带 技术 构建 各 分 
公司 的 集中 交易 模式 。 

复制 技术 在 应 用 方面 主要 有 以 下 两 种 模式 。 

(1) 同步 远程 复制 。 实 时 地 同步 数据 ， 最 大 限度 保证 数据 的 一 臻 性， 以 减少 灾难 发 
生 时 的 数据 丢失 量 。 

(2) 异步 远程 复制 。 周 期 性 地 同步 数据 ， 最 大 限度 减少 由 于 数据 远程 传输 时 延 造成 
的 业务 性 能 下 降 。 

两 种 模式 的 简单 对 比如 表 12-5 所 示 。 
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表 12-5 两 种 复制 模式 的 简单 对 比 





必须 在 通知 源 站 点 写 完成 前 ， 将 写 操作 同时 提 | oo a a 
交 源 和 目标 。 在 先前 写 操作 完成 并 通知 主机 前 ， pee eee poe 
不 能 进行 额外 写 操作 一 次 写 两 个 地 方 ， 都 完 | Me 点 ， 之 后 


成 了 源 站 点 ， 才 能 进行 下 一 个 写 操作 ) 目标 站 所 


优点 如 果 源 发 生 故 障 ， 同 步 复制 提供 0 或 接近 0 的 | 减少 响应 时 间 对 主机 性 能 的 影响 。 不 限制 
”| 恢复 氮 指标 级 最 低 恢复 时 间 两 个 站 点 部 署 距离 


写 响 应 时 间 影 响 主机 性 能 ， 而 且 两 个 站 点 越 | 恢复 点 指标 级 ， 最 低 恢 复 时 间 不 及 同步 
缺点 | 远 ， 影 响 越 大 。 两 个 站 点 部 署 距离 必须 小 于 | 远程 复制 。 不 适合 要 求 不 间断 服务 的 源 
200km 站 点 


操作 





说 明 : 

上 面 描 述 中 ， 源 、 目 标的 含义 如 下 。 

。 源 : 指 位 于 主 站 点 的 存储 信息 资产 的 基础 设施 。 

。 目标 : 指 位 于 远程 站 点 的 存储 信息 副本 的 基础 设施 。 
。 访问 源 和 目标 的 主机 分 别 为 源 主 机 和 目标 主机 


由 于 复制 模式 的 不 同 ， 数 据 写 入 从 LUN 的 原理 也 不 同 。 下 面 详细 介绍 同步 远程 复 
制 和 异步 远程 复制 处 理 主机 写 VO 的 原理 。 

l. 同步 远程 复制 写 操作 

同步 远程 复制 需要 将 主 端 存 储 系 统 上 的 数据 实时 地 同步 到 从 端 存 储 系 统 上 。 其 特点 
如 下 。 

(1) 主 端 存储 系统 接收 到 主机 的 写 IO 请 求 后 ， 分 别 发 送 写 VO 请 求 至 从 LUN ME 
LUN. 
(2) RA LUN 和 从 LUN 都 执行 写 操作 成 功 时 ， 才 向 主 机 返回 写 VO 请 求 成 功 。 
当主 LUN 和 从 LUN 建立 同步 远程 复制 关系 之 后 ， 需 要 对 远程 复制 进行 一 次 手动 同 
步 ， 以 保证 主 LUN 和 从 LUN 的 数据 一 致 。 同 步 完 成 后 ， 每 一 次 主机 向 主 端 存储 系统 写 
入 数据 ， 都 会 实时 同步 到 从 端 存 储 系统 的 从 LUN 中 。 其 中 某 一 次 写 入 数据 块 N， 同 步 
远程 复制 处 理 此 次 写 VO 的 原理 如 图 12-5 所 示 。 

2. 异步 远程 复制 写 操作 

异步 远程 复制 是 指 将 主 端 存 储 系 统 上 的 数据 周期 性 地 拷贝 到 从 端 存储 系统 上 。 其 特 
AMTF. 

(1) 异步 远程 复制 依赖 于 快照 技术 。 快 照 是 指 源 数据 在 某 个 时 间 点 的 一 致 性 数据 
副本 。 

(2) 主机 对 主 LUN 进行 写 操 作 ， 只 要 主 LUN 返回 写 请 求 成 功 ， 就 向 主机 返回 写 请 

(3) 通过 用 户 手动 触发 或 系统 定时 触发 同步 ， 保 证 主 LUN 和 从 LUN 数据 一 致 。 

当主 LUN 和 从 LUN 建立 异步 远程 复制 关系 之 后 ， 启 动 初始 同步 ， 将 主 LUN 数据 
全 部 复制 到 从 LUN， 以 保证 主 LUN 和 从 LUN 数据 的 完全 一 致 。 初始 同步 完成 后 的 写 操 
作 如 下 。 
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图 12-5 同步 远程 复制 的 写 VO 原理 


主 端 存储 系统 接收 到 主机 发 送 的 写 IO 时 ， 发 送 写 VO 至 主 LUN， 只 要 主 LUN 
BAS IO 成 功 ， 主 端 存储 系统 就 向 主机 返回 写 IO 成 功 。 从 LUN 的 数据 在 同步 周期 到 
达 时 ， 再 进行 主 LUN 和 从 LUN 数据 的 同步 。 其 中 某 一 次 写 入 数据 块 N， 异 步 远程 复制 
处 理 此 次 写 VO 的 原理 如 图 12-6 Ara. 
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图 12-6 异步 远程 复制 的 写 IO 原理 


12.6 容 灾 技术 的 实现 方式 


容 灾 技术 发 展 至 今 ， 其 类 型 众多 ， 过 去 企业 广泛 采用 的 是 以 备份 磁带 为 基础 的 远程 
容 灾 方 式 ， 而 如 今 这 种 方式 已 经 渐渐 优化 到 通过 网 络 连接 来 将 本 地 端的 数据 复制 一 份 到 
远程 保存 。 

容 灾 分 为 同城 容 灾 和 异地 容 灾 两 种 。 
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l. 同城 容 灾 

同城 容 灾 通常 是 指 在 同一 个 地 区 选择 不 同 机 房 、 不 同 楼 层 或 楼 宇 来 建设 容 灾 系统 ， 
目的 是 防备 软 硬 件 故障 、 机 房 停 电 、 中 毒 、 人 为 误 操作 等 更 加 常见 的 破坏 因素 ,或 者 准 
备 一 套 备 用 系统 用 于 例 行 维护 ， 或 者 实现 生产 、 查 询 相 分 离 的 业务 建设 。 这 样 的 建设 非 
常 实惠 。 

2. FHA RK | 

异地 容 灾 则 是 为 了 防止 如 地 震 、 火 灾 、 丢 失 等 区 域 性 的 大 规模 灾难 造成 的 损失 而 选 
择 在 其 他 不 同 的 地 区 建立 灾 备 系统 。 其 通过 在 异地 建立 起 数据 的 备份 ， 进 一 步 提高 了 数 
据 抵抗 各 种 可 能 安全 因素 的 容 灾 能 力 。 

从 投入 成 本 和 故障 发 生 概 率 来 考虑 ， 企 业 一 般 都 会 按照 “ 先 本 地 ， 再 异地 ”的 由 近 
及 远 原 则 建设 容 灾 系统 。 先 在 同一 个 机 房 的 不 同 主 机 和 存储 上 建设 ， 或 在 不 同 的 楼 层 和 
楼 宇 建设 一 个 备份 中 心 。 经济 条 件 具备 的 ， 考 虑 同城 建设 一 个 备份 机 房 。 在 实际 操作 中 ， 
很 多 企业 基本 都 会 在 本 地 建设 一 个 高 等 级 的 、 投 入 也 不 大 的 容 灾 ， 然 后 在 分 部 或 者 同城 
其 他 地 方 做 一 个 异地 备份 。 这 样 的 建设 方案 投入 不 大 ， 比 较 实 惠 。 

随 着 光纤 存储 网 络 技术 的 成 熟 ， 以 及 其 在 距离 上 的 拓展 ， 光 纤 城 域 存储 网 络 的 实现 
已 经 趋 于 成 熟 ， 现 在 不 再 需要 依赖 复杂 的 数据 复制 技术 ， 就 可 以 实现 同城 容 灾 。 下 面 主 
要 讨论 异地 容 灾 的 实现 方式 。 

异地 容 灾 的 实现 方式 主要 有 两 种 类 型 : 主机 型 (hostbased) 和 存储 系统 型 (storage 
based). 

(1) 主机 型 远程 容 灾 

主机 型 远程 容 灾 简单 地 说 ， 就 是 通过 安装 在 服务 器 的 数据 复制 软件 ， 或 应 用 程序 提 
供 的 数据 复制 /灾难 恢复 工具 〈 如 数据 库 的 相关 工具 )， 利 用 TCP/IP 网 络 连接 远 端的 容 备 
服务 器 ， 实 现 异 地 数据 复制 。 

基于 主机 实现 的 容 灾 技术 的 特点 可 以 归 为 以 下 几 点 。 

。 需要 在 主机 上 安装 相应 软件 ,一 些 甚至 需要 更 改 相应 的 分 区 技术 ,这 种 方式 需要 

支付 软件 的 授权 费 ， 也 会 消耗 主机 的 运行 资源 。 

。 需要 实施 现 有 系统 停机 调整 。 

。 单个 费用 稍 低 ， 在 服务 器 较 少 的 环境 下 ， 所 需 成 本 小 ， 用 户 不 需要 更 换 太 多 现 有 

的 系统 架构 ， 也 不 用 担心 系统 的 兼容 性 问题 。 

o 当 服 务 器 数量 较 多 时 ， 管 理 复杂 程度 会 大 幅 增加 ， 整 体 投 入 成 本 也 会 大 大 增加 。 

(2) 存储 系统 型 远程 容 灾 

存储 系统 型 远程 容 灾 顾名思义 是 基于 存储 系统 〈 光 纤 磁盘 阵列 、NAS) 的 模式 。 使 
用 存储 系统 内 建 的 固件 (firmware) 或 操作 系统 ， 通 过 IP 网 络 或 DWDM、 光 纤 通 道 等 
传输 介质 连接 ， 将 数据 以 同步 或 异步 方式 复制 到 远 端 。 知 名 的 存储 系统 型 远程 容 灾 方案 
有 SRDF、TrueCopy、PPRC 等 。 

基于 存储 数据 级 实现 的 容 灾 技 术 的 特点 可 归纳 为 以 下 几 点 。 

。 不 占用 主机 资源 ， 其 将 数据 与 运行 分 开 ， 对 主机 系统 的 运行 资源 影响 较 小 ， 效 

率 高 。 
。 需要 的 链 路 设备 较 多 , 因为 用 户 要 在 本 地 端 和 灾 备 端 分 别 配置 两 套 相同 的 存储 系 
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统 ， 不 仅 采 购 成 本 高 ， 也 要 受制 于 单一 的 设备 厂商 ， 未 来 拓展 性 缺乏 弹性 。 
。 单个 投资 较 大 ， 与 主机 数量 无 关 。 
。 对 于 数据 库 的 一 致 性 容 灾 存在 很 大 缺陷 ， 在 多 点 到 一 点 的 容 灾 架构 上 存在 不 适 
用 性 。 
对 比 这 两 种 不 同 的 容 灾 技术 实现 方式 可 以 发 现 ， 主 机 型 远程 容 灾 在 实际 中 将 会 存在 
很 大 的 局 限 性 ， 而 存储 系统 型 远程 容 灾 的 缺点 是 成 本 更 加 高 昂 。 


12.7 ”构建 容 灾 解决 方案 


容 灾 技 术 是 灾 备 系统 的 核心 ， 许 多 企业 在 下 达 灾 备 系统 建设 任务 之 后 ， 一 直 都 无 法 
在 技术 方案 的 论证 环节 上 统一 ， 由 此 可 以 看 出 ， 找 到 一 个 完美 的 容 灾 解决 方案 ， 是 一 件 
十 分 艰难 的 事情 。 在 众多 构建 容 灾 解 决 方案 实例 的 基础 上 ， 逐 渐 形 成 了 一 些 通用 的 方法 
和 流程 。 现 在 就 从 用 户 切 实 的 容 灾 系统 技术 和 可 行 性 出 发 ， 对 构建 容 灾 系统 时 的 通用 流 
程 进行 简单 的 概括 和 分 析 。 

1. 明确 容 灾 将 要 防范 的 “ 灾 ” 

明确 容 灾 将 要 防范 的 “ 灾 ” 即 明确 计算 机 系统 等 可 能 遇 到 的 灾难 类 型 ， 如 系统 故障 、 
人 硬件 问题 、 数 据 逻 辑 受 损 、 火 灾 地 震 等 ,对 于 不 同情 形 ， 采取 的 应 对 措施 也 是 不 尽 相同 。 
例如 ， 传 统 的 容 灾 手 段 重点 集中 在 大 型 站 点 类 灾难 的 恢复 能 力 上 主要 指 自然 和 电力 等 
KH) 一 般 不 具有 防范 软件 和 人 为 错误 (如 各 类 失误 ) 等 的 能 力 ， 因 此 这 类 灾 备 系统 不 
具有 涵 凑 全 系列 灾难 防范 的 内 容 ， 当 需要 建设 防范 更 加 全 面 的 容 灾 系 统 时 ， 就 不 得 不 重 
新 考虑 升级 和 改进 新 一 代 的 系统 。 就 一 般 而 言 ， 硬 件 故障 、 人 为 失误 、 软 件 错误 居 信 息 
系统 故障 发 生 概率 会 占据 前 三 位 ， 上 自然 灾害 等 则 属于 小 概率 事件 ， 但 由 于 破坏 力 巨 大 ， 
也 是 容 灾 系 统 不 得 不 考虑 的 重要 内 容 。 

2. 尽 可 能 减 小 容 灾 系统 的 存在 形成 的 影响 

容 灾 系统 的 存在 与 否 ， 对 现 有 业务 造成 的 影响 肯定 是 不 同 的 。 一 个 好 的 容 灾 系 统 ， 
应 该 能 极 少 地 影响 到 当前 业务 的 运营 ， 对 其 不 造成 任何 障碍 ， 而 不 是 通过 限制 一 些 系 
统 的 正常 行为 来 达到 保护 系统 数据 的 目的 。 这 就 要 求 构 建 容 灾 方 案 在 工程 上 应 具有 可 
操作 性 、 周 期 的 可 控 性 以 及 实施 周期 短 等 特点 ， 这 样 才能 最 大 限度 降低 对 原 有 系统 的 
影响 。 

3， 明 确 业务 能 接受 的 系统 恢复 用 时 

明确 业务 能 接受 的 系统 恢复 用 时 即 必须 知道 当 系统 遇 灾 时 ， 整 个 业务 能 允许 的 “ 竣 
痪 ”时 间 ， 也 就 是 定义 用 户 对 于 计算 机 系统 发 生 故 障 的 最 大 容忍 时 间 〈 即 RTO)。 这 也 
是 在 构建 容 灾 解 决 方案 时 要 考虑 的 重要 技术 指标 。 

4. 确认 数据 的 保护 级 别 

对 于 不 同 重 要 程度 的 数据 ， 所 构建 的 容 灾 方案 也 是 不 同 的 。 有 些 数据 可 能 并 不 需要 
完全 恢复 ， 而 有 些 重要 数据 可 能 要 完全 且 完 整地 都 恢复 出 来 〈 即 RPO)， 并 且 数 据 的 保 
护 级 别 高 低 也 涉及 是 否 在 数据 恢复 的 同时 ， 还 要 实时 地 同步 数据 ， 这 些 都 是 影响 容 灾 方 
案 构 建 的 重要 因素 。 
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5. 容 灾 系 统 具 有 较 低 的 维护 难度 

毫 无 疑问 ， 一 个 管理 界面 友好 和 易 操作 的 容 灾 系 统 更 容易 被 人 接受 。 谁 都 不 想 面 对 
一 个 复杂 、 成 本 高 、 维 护 难度 很 大 的 灾 备 系统 ， 当 然 ， 这 不 仅 要 考虑 到 容 灾 技 术 本 身 ， 
以 及 容 灾 系 统 的 管理 系统 本 身 是 否 易学 、 易 用 和 易 维 护 ， 管 理 人 员 所 具有 的 管理 能 力 和 
维护 能 力也 是 重要 因素 。 

6. 容 灾 系 统 所 用 技术 具有 一 定 的 可 移植 性 

这 是 很 容易 忽略 的 一 点 ， 就 是 容 灾 使 用 的 技术 和 手段 是 否 适 用 于 现 有 的 所 有 参与 系 
统 以 及 今后 可 能 加 入 的 其 他 业务 系统 。 这 点 经 常 成 为 容 灾 体系 技术 路 线 讨 论 中 最 为 困扰 
的 一 个 因素 。 尽 量 在 第 一 次 建立 容 灾 系统 时 ， 就 采用 有 前 瞻 性 的 技术 ， 从 而 形成 一 次 构 
建 ， 长 期 受益 的 良好 架构 ， 而 且 一 旦 这 样 的 系统 建立 好 ， 在 未 来 加 入 各 种 其 他 系统 时 所 
需 的 改造 成 本 会 十 分 轻微 ， 使 系统 具有 优异 的 可 拓展 性 和 弹性 。 因 此 ， 在 选择 容 灾 技术 
和 容 灾 产 品 时 ， 应 该 选择 主流 的 技术 和 实力 雄厚 的 供应 商 的 产品 。 因 为 ， 通 常 业 界 主流 
的 技术 ， 更 容易 被 后 来 的 技术 兼容 ， 实 力 雄 厚 的 系统 供应 商 ， 在 开发 新 技术 时 ， 能 够 更 
多 地 考虑 技术 的 可 移植 性 。 

还 有 一 些 其 他 非 主 流 因素 ， 就 不 再 一 一 更 述 了 。 由 此 可 见 ， 想 要 构建 一 个 好 的 长 久 
的 容 灾 解决 方案 并 不 是 一 件 容易 的 事情 ， 它 需要 从 各 个 方面 去 权衡 利 环 、 裁 量 得 失 ， 这 
样 才能 找到 一 个 具有 最 高 性 价 比 的 方案 。 


12.8 ”华为 容 灾 方案 的 实现 和 应 用 


12.8.1 ”产品 介绍 


华为 在 这 方面 推出 的 产品 很 多 ， 典 型 的 像 VIS6000T、APM 等 ， 下 面 介 绍 OceanStor 
VIS6000。 

l. 产品 定位 

虚拟 智能 存储 (Virtual Intelligent Storage) 是 一 款 存 储 虚 拟 化 产品 ， 它 通过 独特 的 虚 
拟 化 技术 ， 整 合 I SAN、FC SAN 异 构 存储 资源 ， 将 复杂 的 异 构 环境 简化 为 统一 虚拟 存 
储 池 ， 并 提供 丰富 的 存储 特性 ， 提 升 管理 效率 和 资源 利用 率 ， 从 而 减少 客户 开销 。 

该 产品 的 定位 如 下 。 

。 提供 异 构 存 储 环境 下 的 数据 整合 、 统 一 管理 。 

。 提供 存储 系统 的 数据 备份 、 实 时 数据 保护 与 恢复 功能 。 

。 提供 在 线 数据 迁移 的 解决 方案 。 

。 提供 安 人 全、 可靠、 方便、 快捷 的 数据 容 灾 功能 。 

其 硬件 如 表 12-6 所 示 。 


表 12-6 产品 硬件 


处 理 器 | o o Eas SON S645X2 | 
内 存 容量 | 48GB X2 


256 信息 存储 与 IT 管理 


(BERS) 
前 端 端口 类 型 8GB FC 和 1/10GE (iSCSI) 
后 端 端口 类 型 8GB FC 和 1/10GE (iSCSI) 
最 大 业务 端口 数 20 (8GBFC) /10 (10GE) /20 (GE) 
最 大 卷 数目 4 096 
最 大 LUN 数目 4 096 
最 大 主机 数量 1024 FC/256 iSCSI 


2. 功能 特性 介绍 
(1) 强大 的 异 构 存储 虚拟 化 能 力 
。 业界 领先 的 广泛 兼容 性 ， 能 够 兼容 业界 主流 的 存储 设备 。 
。 基于 网 络 层 的 异 构 存 储 虚 拟 化 技术 , 能 够 将 不 同 厂商 存储 整合 为 统一 的 存储 资源 
池 ， 实 现存 储 资源 共享 和 统一 管理 。 
。 原 有 存储 数据 无 需 迁 移 和 转换 。 
(2) 良好 的 可 靠 性 和 运行 稳定 性 
。 多 节点 集群 技术 。 
。 关键 部 位 全 元 余 。 
。 可 热 插 拔 接口 卡 。 
(3) 灵活 的 业务 与 数据 保护 功能 
。 快照 : 虚拟 和 完整 空间 快照 ， 对 数据 进行 时 间 点 保护 ， 预 防 客户 可 能 面临 的 软 
灾难 。 
。 镜像 : 卷 镜 像 技术 , 在 2 台 或 多 台 存 储 设备 之 间 建 立 实 时 镜像 ， 保 证 客户 的 业务 
不 受 单 台 存 储 设 备 故 障 影响 。 
。 远程 复制 :业界 领先 的 VO 级 远程 复制 技术 ， 实 现 异 构 存 储 之 间 跨 地 域 的 数据 
容 灾 。 
”4) 镜像 技术 
。 特性 描述 : 镜像 卷 是 和 生产 卷 相同 的 拷贝 ,通常 不 在 一 个 磁盘 系统 中 。 
。 功能 优点 : 其 中 一 个 卷 故障 ， 另 外 的 卷 可 提供 连续 的 数据 访问 ， 是 经 济 的 本 地 数 
据 保护 方式 。 
3. 典型 应 用 案例 
OceanStor VIS6000T 广泛 应 用 于 多 个 国家 或 地 区 的 运营 商 、 金融 、 媒 体 、 能 源 、 交 
i. E DAE. 政府 等 行业 , 案例 包括 黑龙 江 联 通 \ 工 行 杭州 分 行 、 沙 特 STC, t] CCBS、 
墨西哥 SCT、 委 内 瑞 拉 CDC、 智 利 VTR、 南 非 Telkom 等 。. 
(1) 某 移动 集团 异 构 整合 
方案 : 
© 在 数据 中 心 ， 部 署 4 台 VIS 集群 ， 对 不 同 厂 家 的 阵列 进行 统一 虚拟 化 管理 。 
。 VIS 对 外 提供 存储 资源 管理 接口 ， 更 好 地 为 私有 云 业务 服务 。 
。 主机 层面 采用 虚拟 化 技术 。 
价值 : 
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。 构建 了 按 需 分 配 资源 的 私有 云 业 务 基础 架构 。 

。 开放 的 体系 ， 有 利于 存储 空间 、 处 理 能 力 的 平滑 扩容 。 

(2) 某 中 心 医 院 同 城 镜像 

方案 : 

。 使 用 裸 光 纤 、 长 波 模块 将 距离 Ikm 左右 的 4 台 交 换 机 两 两 级 联 。 
。 部 署 VIS 镜像 ， 提 供 同城 可 靠 保 障 。 

价值 : 

。 构建 同城 数据 高 可 靠 系统 ， 使 RTO 和 RPO 等 于 0。 

e 依旧 使 用 老 阵列 HP EVA6400， 有 效 节 约 投资 。 

(3) 菜农 商行 异地 数据 容 灾 

方案 : 

© 在 本 地 数据 中 心 ， 使 用 VIS 虚拟 化 功能 ， 整 合 不 同 厂 家 阵列 。 
© 采用 远程 容 灾 技术 ， 将 本 地 数据 复制 到 距离 100km 外 的 远程 中 心 。 
价值 ; 

。 虚拟 化 整合 异 构 阵 列 ， 高 效 利用 原 有 投资 。 

© JIO 级 别 容 灾 技术 ， 有 效 利用 传输 带宽 。 


12.8.2 ” 容 灾 方案 的 应 用 


下 面 详细 介绍 华为 推出 的 几 种 企业 级 容 灾 方案 。 

1. 同城 容 灾 解决 方案 

(1) 背景 

华为 同城 容 灾 解 决 方案 在 客户 业务 系统 生产 中 心 的 同城 ， 建 立 一 个 灾 备 中 心 ， 旨 在 
解决 生产 中 心 发 生 电路 故障 或 火灾 等 灾难 时 ， 业 务 瘫痪 或 数据 丢失 等 问题 ， 确 保 在 灾 备 
中 心 信息 系统 数据 零 丢 失 、 业 务 快速 切换 ， 最 大 化 保护 业务 系统 连续 运行 。 

随 着 信息 系统 的 快速 发 展 ， 银 行 、 保 险 、 政 府 、 教 育 和 电信 等 行业 业务 大 集中 速度 
的 加 快 ， 企 业 的 技术 风险 也 相对 集中 。 一 旦 生产 中 心 需要 升级 维护 ， 或 发 生 停电 、 火 灾 
等 灾难 时 ， 将 导致 企业 所 有 分 支 机 构 、 营 业 网 点 和 全 部 的 业务 处 理 停顿 ， 甚 至 客户 数据 
丢失 ， 给 企业 带 来 巨大 的 经 济 和 名 誉 损失。 据 此 ， 基 于 华为 存储 的 同城 容 灾 解决 方案 应 
运 而 生 ， 骨 在 帮助 企业 建设 高 可 用 、 高 可 靠 、 高 业务 连续 性 的 数据 中 心 。 

(2) 解决 方案 

1) 双 活 方案 

华为 提出 以 虚拟 化 智能 存储 为 基础 的 存储 双 活 架构 ， 为 客户 建设 业务 不 间断 运行 的 
解决 方案 。 两 个 数据 中 心 都 处 于 运行 状态 ， 可 同时 承担 相同 业务 ， 提 高 数据 中 心 的 整体 
服务 能 力 和 系统 资源 利用 率 ， 并 且 互 为 备份 ， 当 单数 据 中 心 故障 时 ， 业 务 上 自动 切换 到 另 
一 数据 中 心 ， 实 现 RPO=0，RTO~0， 解 决 了 传统 灾 备 中 心 不 能 承载 业务 和 业务 无 法 上 自动 
切换 的 问题 。 双 活 方案 的 示意 图 如 图 12-7 所 示 。 

2) 存储 虚拟 化 镜像 方案 

华为 存储 虚拟 化 镜像 方案 ， 利 用 VIS 镜像 卷 技术 ， 保 证 两 个 数据 中 心 存 储 阵列 之 间 
数据 的 实时 同步 ， 确 保生 产 单 存 储 或 数据 中 心 发 生 灾 难 时 ， 另 一 中 心 有 相 同 数据 可 供 访 
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问 。 由 于 VIS 镜像 卷 技 术 ， 在 SAN 网 络 层 屏蔽 异 构 存 储 差 异 ， 同 时 对 主机 层 透 明 ， 当 
任 一 存储 阵列 故障 时 ， 镜 像 阵 列 无 颖 接管 业务 ， 数 据 零 丢失 ， 业 务 零 中 汤 。 存 储 虚 拟 化 
的 镜像 方案 示意 图 如 图 12-8 Pra. 
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12-7 双 活 方案 示意 图 
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12-8 存储 虚拟 化 镜像 方案 示意 图 


3) 磁盘 阵列 同步 复制 方案 

华为 磁盘 阵列 同步 复制 方案 , 采用 OceanStor V3. 系列 和 18000 系列 高 端 存储 的 同步 
远程 复制 技术 ， 在 磁盘 阵列 层 提 供 生 产 中 心 与 灾 备 中 心间 的 数据 实时 同步 ， 实 现 生 产 单 
存储 或 生产 中 心 发 生 灾难 时 ， 数 据 零 丢失 ， 同 时 配合 一 致 性 组 功能 和 华为 UltraAPM 软 
件 ， 确 保 数据 库 应 用 数据 一 致 性 和 业务 的 快速 拉 起 。 该 方案 的 示意 图 如 图 12-9 所 示 。 
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图 12-9 ”磁盘 阵列 同步 复制 方案 示意 图 


2. 异地 容 灾 解决 方案 

(1) 背景 

近年 来 ， 世 界 上 一 系列 大 型 自然 灾难 性 突 发 事件 频繁 发 生 ， 这 些 突 发 灾难 导致 的 往 
往 是 一 个 城市 ， 甚 至 是 一 个 区 域 的 毁灭 性 破坏 ， 企 业 只 做 本 地 的 数据 见 余 保护 或 容 灾 建 
设 ， 已 不 能 规避 区 域 性 灾难 对 企业 数据 的 破坏 ， 也 无 法 保证 业务 连续 性 建设 的 需求 。 异 
地 数据 保护 及 保障 企业 业务 连续 性 成 为 了 企业 蝶 待 解决 的 问题 。 男 外 ， 企 业 在 远程 容 灾 
建设 中 ， 也 面临 网 络 链 路 租赁 费用 高 昂 、 网 络 带宽 不 够 以 及 传输 数据 安全 性 的 问题 。 

为 满足 企业 远程 容 灾 的 需求 ， 华 为 提供 了 远程 容 灾 解 决 方案 。 

华为 远程 容 灾 解决 方案 的 核心 是 尽 可 能 减少 宕 机 时 间 及 数据 丢失 量 ， 保 障 上 层 业 务 
的 连续 性 ， 把 损失 降 到 最 低 。 远 距离 数据 容 灾 时 ， 对 企业 传输 数据 进行 压缩 ， 减 少数 据 
传输 量 ， 进 而 减少 对 带宽 的 需求 ， 尽 可 能 节约 企业 投资 成 本 。 同 时 ， 对 传输 数据 进行 加 
密 处 理 ， 并 结合 华为 接 入 认证 、 网 络 安 全 、 访 问 控制 等 技术 ， 为 企业 容 灾 数据 进行 全 方 
位 安全 防护 。 

(2) 解决 方案 

结合 客户 的 业务 应 用 场景 和 业务 连续 性 需求 ， 华 为 提供 了 基于 虚拟 化 智能 存储 远程 
容 灾 解 决 方案 和 阵列 异步 复制 远程 容 灾 解 决 方案 ， 客 户 可 以 根据 自己 的 业务 需求 以 及 现 
网 IT 架构 选择 最 优 的 远程 容 灾 方案 。 

1) 虚拟 化 智能 存储 远程 容 灾 解决 方案 

华为 虚拟 化 智能 存储 远程 容 灾 解决 方案 ， 首 先 ， 利 用 虚拟 化 技术 屏蔽 不 同 厂商 磁盘 
阵列 差异 ， 实 现 不 同 厂商 磁盘 阵列 的 资源 整合 ， 充 分 利用 企业 已 有 投资 设备 ， 节 约 投资 
成 本 ， 其 次 ， 通 过 业界 领先 的 VO 级 远程 复制 技术 ， 有 效 节约 复制 带宽 ， 降 低 企 业 网 络 
链 路 投资 成 本 ; 然后 ， 华 为 完善 的 容 灾 管理 平台 ， 使 容 灾 管理 简易 化 ， 降 低 企业 维护 管 
理 成 本 。 

当 企 业 生 产 中 心 发 生 灾 难 时 ， 业 务 可 快速 切换 到 灾 备 中 心 继续 对 外 提供 服务 ， 保 障 
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企业 业务 的 连续 性 ，RPO=<0。 智 能 存储 远程 容 灾 解决 方案 的 示意 图 如 图 12-10 Ara. 





图 12-10 智能 存储 远程 容 灾 解决 方案 


2) 阵列 异步 复制 容 灾 解 决 方案 

华为 阵列 异步 复制 容 灾 解决 方案 ， 支 持 华 为 高 、 中 、 低 端 阵列 容 灾 业务 互通 ， 灾 备 
中 心 存储 设备 选 型 相对 多 样 化 ， 降 低 了 容 灾 系统 的 建设 成 本 ; 阵列 支持 最 高 4:1 的 数据 
压缩 功能 ， 有 效 降低 容 灾 链 路 投资 ,支持 数据 传输 加 密 功 能 ， 确 保 容 灾 数 据 的 安全 性 。 

当 生 产 中 心 发 生 灾难 时 ， 利 用 应 用 级 数据 保护 与 容 灾 软 件 快速 切换 容 灾 ， 保 障 企业 
业务 的 连续 性 , 尽 可 能 减少 RPO 和 RTO。 阵 列 异步 复制 容 灾 解决 方案 的 示意 图 如 图 12-11 
所 示 。 : 





12-11 阵列 异步 复制 容 灾 解决 方案 
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3. 两 地 三 中 心 容 灾 解 决 方案 

(1) 背景 

近年 来 为 预防 大 范围 自然 灾害 ， 多 点 灾 备 方式 逐渐 成 为 灾 备 领域 发 展 的 重要 方 问 之 
一 。 其 中 ， 同 城 灾 备 中 心 结合 异 地 灾 备 中 心 的 “两 地 三 中 心 ” 灾 备 解决 方案 越 来 越 受 到 
业界 重视 和 认可 。 两 地 三 中 心 的 主要 作用 是 在 业务 中 心 遭 遇 自 然 灾害 或 人 为 破坏 时 ， 在 
异地 的 灾 备 中 心 能 够 提供 有 效 的 信息 服务 ， 从 而 保证 业务 连续 性 。 

(2) 解决 方案 

针对 客户 的 不 同 需 求 ， 华 为 结合 自己 的 产品 提供 了 不 同 架 构 的 两 地 三 中 心 容 灾 
方案 。 

架构 一 : 基于 华为 统一 存储 多 级 跳 复 制 技 术 的 两 地 三 中 心 方案 

基于 华为 统一 存储 多 级 跳 复制 技术 ， 并 结合 专业 的 容 灾 管理 软件 实现 数据 的 两 地 三 
中 心 保护 。 该 方案 在 生产 中 心 、 同 城 灾 备 中 心 和 异地 灾 备 中 心 分 别 部 署 华为 OceanStor 
统一 存储 设备 ， 通 过 异步 远程 复制 技术 ， 将 生产 中 的 数据 复制 到 同城 灾 备 中 心 ， 再 到 寞 
地 灾 备 中 心 ， 实现 数据 的 保护 。 若 生产 中 心 发 生 灾 难 ， 可 在 同城 灾 备 中 心 实现 业务 切换 ， 
并 保持 与 异地 灾 备 中 心 的 容 灾 关系 ; 若 生 产 中心 和 同城 灾 备 中 心 均 发 生 灾 难 ， 可 在 异地 
灾 备 中 心 实 现 业 务 切换 。 该 方案 的 示意 图 如 图 12-12 所 示 。 
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图 12-12 基于 华为 统一 存储 多 级 耻 复 制 技术 的 两 地 三 中 ， 方案 示意 图 


架构 二 : 基于 华为 虚拟 化 智能 存储 设备 和 统一 存储 相 结 合 的 “两 地 三 中 心 ” 方 案 

基于 华为 虚拟 化 智能 存储 设备 (OceanStor VIS6000T) 的 镜像 技术 和 统一 存储 远程 
复制 技术 ,实现 两 地 三 中 心 数 据 保护 。 在 生产 中 心 部 署 VIS6000T， 同 城 灾 备 中心 和 异地 
灾 备 中 心 部 署 统一 存储 设备 (可 以 根据 客户 的 需求 在 同城 灾 备 中 心 部 署 VIS6000T, 与 生 
产 中 心 组 成 四 节点 集群 )。 首 先 利 用 虚拟 化 智能 存储 设备 ， 实 现 同城 数据 镜像 保护 ， 任 意 
单 存 储 故 障 时 数据 读 写 路 径 自 动 切换 ， 其 次 利用 远程 复制 技术 ， 将 同城 灾 备 中 心 数据 容 
灾 到 异地 灾 备 中 心 ， 当 生产 中 心 、 同 城 灾 备 中 心 都 发 生 灾 难 时 ， 可 快速 进行 业务 切换 。 
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该 方案 的 示意 图 如 图 12-13 所 示 。 
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4. 云 容 灾 解决 方案 

(1) 背景 

Bias IT 信息 化 技术 的 不 断 发 展 , 信息 系统 在 各 行 各 业 中 扮演 着 举足轻重 的 作用 ， 建 
设 容 灾 系统 成 为 了 必 不 可 少 的 选择 ， 然 而 面 对 分 支 机 构 众 多 的 政府 单位 或 者 大 企业 ， 容 
灾 系 统 的 建设 将 会 面临 投资 大 、 管 理 难 、 不 安全 的 各 种 挑战 。 

大 型 容 灾 系统 建设 投资 大 , 周期 长 ,如 何 实现 集约 化 的 容 灾 建 设 模式 ?如 何 减少 
容 灾 投资 和 后 期 维护 成 本 ? 

容 灾 系统 相对 复杂 , 特别 是 大 型 集中 式 容 灾 系 统 在 管理 和 维护 上 更 是 一 项 极 具 难 
度 的 挑战 。 

数据 如 果实 现 集中 的 灾 备 , 数据 安全 如 何 得 到 很 好 的 保障 ? 核心 数据 在 网 络 上 传 
输 ， 如 何 保障 数据 传输 的 安全 ?这些 都 是 我 们 在 容 灾 建设 中 面临 的 挑战 。 

(2) 解决 方案 

华为 公司 基于 对 政府 和 企业 客户 集中 灾 备 需求 的 深入 了 解 ， 结 合 华为 在 存储 容 灾 领 
域 的 技术 积累 ， 推 出 了 华为 云 容 灾 解 决 方案 。 它 解决 了 传统 容 灾 模 式 的 棘 端 ， 实 现 了 集 
约 化 的 灾 备 建设 模式 ， 降 低 了 整个 容 灾 备份 系统 的 管理 和 维护 难度 ， 同 时 采用 多 种 安全 
技术 ， 确 保 灾 备 数据 的 安全 可 靠 。 但 云 容 灾 也 有 其 局 限 性 ， 就 是 只 适合 对 网 络 宽带 要 求 
不 高 ， 数 据 量 不 大 的 小 企业 使 用 。 

云 容 灾 解 决 方案 的 整体 架构 包括 云 容 灾 中 心 和 容 灾 用 户 接 入 部 分 。 云 容 灾 中 心 采 用 
模块 化 设计 , 客户 可 以 根据 业务 需要 选择 部 署 不 同 的 容 灾 功能 区 , 同时 支持 来 自 不 同 省 、 
市 级 的 众多 个 容 灾 用 户 接 入 ， 数 据 从 容 灾 用 户 端 复制 到 云 容 灾 中 心 。 

容 灾 用 户 可 以 根据 自己 的 数据 安全 级 别 、 业 务 类 型 和 容 灾 需 求 ， 选 择 不 同 的 接 入 方 
式 , 并 在 用 户 生 产 端 部 署 容 灾 接 入 设备 。 通过 容 灾 链 路 实现 实时 或 者 周期 性 的 数据 传输 ， 
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并 最 终 将 容 灾 数据 汇总 到 云 容 灾 中 心 。 通 过 部 署 云 容 灾 管理 平台 ， 统 一 管理 灾 备 系统 中 
的 设备 、 资 源 、 容 灾 业 务 ， 简 化 整个 灾 备 系统 的 管理 和 维护 难度 。 该 方案 的 示意 图 如 
图 12-14 所 示 。 
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图 12-14 云 容 灾 解 决 方案 示意 图 


12.9 ”本 章 总 结 


完成 本 章 学 习 ， 将 能 够 : 

。 了 解 容 灾 的 基础 知识 。 

。 了 解 容 灾 的 基本 实现 方案 。 

。 了 解 容 灾 使 用 的 3 种 常见 技术 : 快照 技术 、 镜 像 技 术 和 复制 技术 。 
。 了 解 容 灾 在 实际 产品 中 的 实现 与 应 用 。 


12.10 ”练习 题 


一 、 选 择 题 
1. 用 于 表示 灾难 发 生 后 恢复 系统 运行 所 需 时 间 的 指标 是 o 
A. RIO B. RTO C. RPO D. TCO 


答案 (B) 
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2. SHARE 78 国际 组 织 提 出 的 标准 ， 可 将 灾难 恢复 解决 方案 分 为 〈 Je 
A. 8% B. 5% C. 7% D. 4% 
答案 〈C) 
3. 占用 空间 小 ， 对 系统 负荷 影响 较 小 的 快照 方式 为 〈 Jo 
A. 写 前 拷贝 快照 B. 分 割 镜 像 快 照 C. 原样 复制 快照 D. 冷 拷贝 快照 
答案 (A) 
4. 数据 镜像 技术 按照 主 从 镜像 存储 系统 所 处 的 位 置 可 分 为 〈 Ý 
A. 本 地 镜像 B， 同 步 镜像 C. 远程 镜像 D. 异步 镜像 
答案 (AC) 
5. 远程 复制 的 两 种 复制 模式 为 ae 
A. 半 同 步 远 程 复制 B. 同步 远程 复制 
C. 半 异 步 远程 复制 D. 异步 远程 复制 
答案 (BD) 


二 、 简 答题 
1. 构建 容 灾 系统 的 一 般 流 程 是 什么 ? 
2. 容 灾 系统 在 华为 产品 中 有 什么 应 用 ? 





13.1 
13.2 
13.3 
13.4 
13.5 
13.6 





什么 是 大 数据 ? 

大 数据 的 特点 和 要 求 

存储 系统 如 何 应 对 大 数据 

华为 针对 大 数据 存储 的 实践 与 应 用 
本 章 总 结 

练习 题 








关于 本 章 


本 章 首 先 介绍 大 数据 的 概念 ， 说 明 大 数据 的 由 来 、 发 展 历 程 、 应 用 及 前 景 ， 之 后 着 重 介 
绍 与 大 数据 存储 相关 的 一 些 基本 概念 和 技术 ， 最 后 介绍 华为 在 大 数据 存储 方向 上 的 相关 产品 
和 解决 方案 。 
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13.1 什么 是 大 数据 ? 


尽管 大 数据 越 来 越 多 地 为 大 众 熟悉 和 重视 ， 但 是 关于 它 的 定义 事实 上 没有 统一 的 标 
准 。 从 计算 机 专业 的 角度 来 看 ， 大 数据 是 指 所 涉及 的 数据 规模 巨大 到 无 法 通过 目前 传统 
的 软件 工具 ， 在 适当 时 间 内 达到 采集 、 分 析 、 管 理 的 海量 数据 集 。 大 数据 的 采集 往往 不 
会 采取 随机 分 析 方 法 〈 如 抽样 调查 )， 而 是 通过 提取 全 部 数据 的 途径 。 

现在 的 IT 企业 对 大 数据 应 用 抱 有 了 无 限 的 期 望 。 尤 其 在 商业 领域 中 , 大 部 分 的 企业 
形成 了 一 个 共识 : 规模 越 大 的 信息 中 ， 往 往 会 包含 着 越 大 的 价值 ， 而 这 些 价值 的 实现 ， 
依赖 于 对 大 数据 的 有 效 存 储 以 及 在 此 基础 上 的 信息 挖掘 。 


13.1.1 大 数据 概述 


尽管 从 常人 的 直观 视角 看 来 ， 存 储 容量 正 变 得 越 来 越 廉价 ， 在 存储 信息 上 应 该 会 变 
得 更 加 游 力 有 余 。 但 实际 上 ， 一 方面 人 类 每 天 都 在 创造 大 量 的 数据 ， 在 此 基础 上 的 信息 
管理 和 信息 挖掘 也 变 得 越 来 越 富 有 挑战 ， 另 一 方面 ， 企 业 对 自己 用 户 的 数据 往往 会 选择 
保留 ， 因 为 这 些 旧 数据 可 以 与 未 来 的 数据 对 比 ， 从 而 给 出 进一步 的 预期 。 

与 以 往 相 比 ， 我 们 不 仅 要 继续 提升 存 信息 的 存储 能 力 ， 更 要 面 对 越 来 越 多 的 数据 类 
型 。 多 样 的 数据 来 源 往往 会 产生 不 同类 别 的 数据 ， 这 些 数 据 源 往往 包括 网 上 交易 、 网 络 
社交 、 传 感 器 、 移 动 设备 以 及 科学 计算 。 除 了 那些 已 知 的 固定 产生 数据 的 数据 源 ， 各 种 
网 络 行为 的 交互 会 大 大 加 快 数 据 的 累积 速度 。 数 据 永远 都 处 在 不 停 地 增长 之 中 。 

在 信息 时 代 的 背景 下 ， 数 据 已 经 同 资本 、 劳 动力 、 原 材料 等 一 样 ， 成 为 了 必 不 可 少 
的 生产 要 素 。 而 它 的 应 用 范围 也 不 仅仅 局 限于 我 们 熟悉 的 IT 产业， 还 包括 医药 、 公 共 卫 
生 、 科 学 研究 〈 尤 其 是 天 文学 和 前 沿 物理 )、 金 融 系 统 ， 等 等 ， 这 些 领 域 都 越 来 越 依 赖 于 
对 大 数据 的 收集 和 分 析 处 理 。 

大 数据 将 逐渐 成 为 现代 社会 基础 设施 的 一 部 分 ， 就 像 公 路 、 铁 路 、 港 口 、 水 电 和 通 
信和 网络 一 样 不 可 或 缺 。 但 就 其 价值 特性 而 言 ， 大 数据 却 和 这 些 物理 化 的 基础 设施 不 同 ， 
不 会 因为 人 们 的 使 用 而 折旧 和 贬值 。 因 此 ， 大 数据 时 代 的 经 济 学、 政治 学 、 社 会 学 和 许 
多 科学 门类 都 会 发 生 巨 大 ， 甚 至 是 本 质 上 的 变化 和 发 展 ， 进 而 影响 人 类 的 价值 体系 、 知 
识 体系 和 生活 方式 。 

可 以 预见 ， 大 数据 在 不 久 的 将 来 会 扮演 举足轻重 的 角色 。 它 很 有 可 能 像 我 们 熟知 的 
运输 、 电 力 、 通 信 一 样 ， 成 为 社会 基础 设施 的 一 部 分 。 而 大 数据 的 存储 将 是 支撑 整个 系 
统 的 基石 ， 稳 固 、 高 效 的 大 数据 存储 技术 将 会 掀 开 信息 时 代 改 革 的 一 页 。 


13.12 大 数据 产生 的 背景 


大 数据 并 不 是 单纯 的 理论 创新 ， 它 的 产生 与 技术 进步 和 应 用 市 场 的 发 展 息息相关 。 
从 大 体 上 看 ， 大 数据 的 产生 背景 主要 包含 以 下 几 个 方面 。 

l. 基础 信息 设施 的 发 展 和 完善 

摩尔 定律 是 过 去 几 十 年 间 信 息 工业 对 计算 机 性 能 预测 的 基础 。 在 其 指引 下 ， 工 业界 
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周期 性 地 推出 新 的 产品 以 追赶 摩尔 定律 。 由 此 , 也 使 得 个 人 和 企业 不 断 升级 计算 机 设备 。 
如 果 将 时 间 跨 度 放 大 ， 那 么 计算 机 对 信息 的 处 理 能 力 ， 在 过 去 几 十 年 间 ， 得 到 了 成 千 上 
万 倍 的 提升 。 

在 20 世纪 60 年 代 ， 存 储 的 价格 高 达 1 万 美元 /MB， 而 现在 仅仅 是 1 美 分 /GB， 价 
格 上 的 差距 达到 了 上 亿 倍 。 

光纤 通信 系统 的 逐渐 普及 ， 也 极 大 地 提升 了 网 络 带宽 。 与 此 同时 ， 网 络 的 接 入 方式 
也 不 仅仅 局 限于 有 线 连接 ， 高 速 无 线 网 络 的 发 展 ， 使 人 们 可 以 随心 所 欲 地 接 入 至 网 络 。 
网 络 带宽 的 增加 、 网 络 接 入 的 便利 和 大 规模 存储 的 成 本 降低 ， 为 大 数据 的 发 展 提供 了 廉 
价 的 存储 和 高 速 的 传输 服务 。 运 算 性 能 、 存 储 成 本 、 传 输 效率 ， 这 三 者 的 提升 使 得 大 规 
模 数据 存储 成 为 了 现实 。 

2， 新 兴 数 据 采 集 和 数据 处 理 技术 的 发 展 

物 联网 是 传感器 技术 进步 的 产物 。 广 泛 分 布 在 各 个 重要 路 段 的 监控 摄像 头 是 物 联 网 
的 一 个 直观 形态 。 而 随 着 技术 的 发 展 ， 传 感 器 网 络 将 深入 生活 中 的 方方面面 ， 如 检测 大 
气 的 温度 、 压 强 、 风 力 ， 检 测 桥 梁 、 铁 路 、 矿 井 等 重要 设施 的 安全 ， 监 控 飞 机 、 汽 车 、 
轮船 的 运行 状态 等 。 这 些 不 同类 型 的 传感器 ， 实 时 产生 大 量 的 数据 ， 而 其 中 的 一 部 分 将 
会 被 持续 地 收集 ， 成 为 大 数据 的 重要 来 源 。 

云 计算 则 更 多 的 改变 了 数据 的 存储 、 访 问 和 处 理 方式 。 在 云 计 算出 现 之 前 ， 数 据 大 
多 呈 分 散 态 势 ， 独 立地 存储 在 个 人 计算 机 或 企业 的 服务 器 中 。 公 用 云 计算 则 倾向 于 将 各 
种 数据 集中 存储 在 几 个 大 型 的 “数据 中 心 ”%” 亦 即 所 谓 的 “云端 ?>。 通 过 集中 式 管 理 ， 使 
存储 成 本 和 处 理 开 销 都 降低 ， 同 时 也 提高 了 数据 的 利用 率 。 数 据 中 心 的 产生 ， 使 得 大 数 
据 的 存储 和 处 理 成 为 了 迫在眉睫 的 任务 。 

3. 移动 智能 终端 普及 

以 智能 手机 、 平板 电脑 为 代表 的 移动 智能 终端 正在 变 得 越 来 越 常见 。 图 13-1 说 明了 
桌面 电脑 和 移动 智能 终端 销量 的 对 比 变化 。 可 以 看 到 , 在 2011 年 , 移动 终端 的 销量 首次 
超过 了 桌面 电脑 ， 而 在 未 来 的 几 年 中 ， 两 者 的 差距 将 越 来 越 大 。 


es PC 与 笔记 本 电脑 









全 球 出 货 量 ( 百 万 ) 


2008 年 。 ”2009 年 a 2011 年 2012 年 ， 2013 年 


图 13-1 ”全球 智 能 手机 与 平板 同 传统 台式 与 笔记 本 电脑 出 货 量 对 比 
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和 传统 的 加 面 电脑 不 同 ， 由 于 移动 终端 具有 无 可 比拟 的 便捷 性 ， 人 们 会 更 倾向 于 使 
用 移动 设备 。 因 此 ， 它 将 给 互联 网 带 来 更 丰富、 更 鲜 活 的 数据 。 以 Apple 公司 2012 年 的 
运营 数据 为 例 : iMessage 功能 目前 每 秒 为 用 户 传 递 28 000 条 信息 ; iCloud 已 经 为 用 户 提 
供 了 总 计 1 亿 多 份 的 文档 ; GameCenter 的 账号 创建 数 达 到 了 1.6 亿 。 传 统 的 数据 处 理 和 
存储 方案 对 于 如 此 庞大 而 且 活 跃 的 数据 集 显 得 力不从心 。 

在 上 述 原 因 的 催化 下 ， 大 数据 技术 应 运 而 生 。 


13.1.3 大 数据 的 发 展 趋势 


数据 的 存储 和 处 理 伴随 着 整个 计算 机 发 展 的 历程 。 大 数据 出 现 后 ， 并 不 意味 着 传统 
的 方法 和 技术 全 部 失效 了 ， 但 是 在 一 些 情 境 中 ， 传 统 的 数据 存储 和 处 理 方 式 已 经 无 法 满 
足 人 们 的 需求 ， 因 此 人 们 需要 新 型 的 技术 解决 所 面临 的 困境 ， 而 这 些 问 题 也 决定 了 大 数 
据 的 发 展 趋势 。 

大 数据 当下 的 发 展 趋势 如 下 。 

1， 非 结构 化 数据 所 占 比 重 持续 增加 

由 于 移动 设备 的 短 劲 发 展 和 成 像 技 术 的 进步 ， 诸 如 图 像 文 件 、 视 频 文 件 、 音 频 文 
件 的 非 结 构 化 数据 在 数据 中 心 占 据 越 来 越 大 的 比重 。 和 传统 的 结构 化 数据 不 同 ， 结 构 
化 数据 库 对 可 变 字 段 长 度 、 重 复 字 段 、 数 据 项 变 长 存放 等 方面 的 缺陷 ， 使 得 其 无 法 有 
效 存储 、 索 引 非 结构 化 数据 。 因 此 ， 优 化 存储 管理 非 结构 化 数据 是 大 数据 的 一 个 重要 
发 展 趋势 。 

2. 倾向 于 向 外 扩展 网 络 接 入 服务 器 (network access server, NAS) 

过 去 15 年 来 ， 数 据 中 心 主流 的 NAS 架构 实际 上 没有 多 少 改变 。 这 些 系 统 的 设计 是 
针对 分 布 式 计算 环境 , 往往 只 能 扩展 到 数 百 个 磁盘 驱动 器 。 而 当 常 规 NAS 存储 环境 应 对 
当下 的 PB 级 存储 需求 时 ， 显 得 力不从心 。 因 此 ， 对 NAS 的 向 外 拓展 技术 也 是 大 数据 发 
展 的 新 领域 。 

3. “绿色 节约 ”成 为 大 数据 发 展 潮流 

越 来 越 多 的 数据 中 心 正在 不 断 寻 求 成 本 节约 的 同时 对 环境 影响 较 小 的 IT 解决 方案 。 
大 数据 的 发 展 将 不 仅仅 着 眼 于 性 能 ， 也 会 更 加 侧重 于 效能 比 。 


13.1.4 大 数据 的 应 用 场景 


1， 互 联网 的 大 数据 时 代 

互联 网 由 于 它 广 阔 的 应 用 领域 以 及 众多 的 用 户 ， 对 新 技术 的 变 音 往往 充满 着 车 勃 的 
活力 和 极 高 的 热忱 。 由 目前 的 发 展 趋势 看 来 ， 互 联网 必 将 走 入 大 数据 时 代 ， 这 与 互联 网 
的 以 下 几 个 特性 密 不 可 分 。 

C1) 网 络 终端 设备 趋 问 多 元 化 

网 络 终端 设备 的 升级 源源 不 断 地 给 互联 网 注入 了 新 的 活力 。 智 能 化 手机 的 普及 带 来 
了 终端 设备 数量 的 大 爆发 。 在 当下 ， 人 们 能 够 使 用 多 种 设备 ， 在 不 同位 置 ， 通 过 多 种 手 
段 来 接 入 互联 网 。 网 络 设备 的 智能 化 和 便携 性 , 也 更 加 强 了 人 们 通过 互联 网 的 信息 交互 。 
在 这 一 过 程 中 ， 将 不 断 地 在 互联 网 上 创造 新 内 容 。 

(2) 在 线 应 用 和 服务 的 茵 和 莹 发 展 
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Facebook. twitter 这 些 名 称 不 仅仅 代表 了 一 个 公司 或 应 用 ， 从 更 深层 次 的 意义 上 说 ， 
它们 也 代表 着 一 种 新 的 沟通 社交 方式 。 越 来 越 丰富 的 在 线 应 用 和 服务 ， 不 断 激励 用 户 创 
造 和 分 享 信息 ， 尤 其 是 社会 化 媒体 业务 ， 带 动 图 片 、 视 频 等 非 结 构 化 数据 飞速 增长 。 

(3) 与 各 垂直 行业 的 充分 融合 

互联 网 作为 一 个 高 渗透 力 的 行业 , 正在 与 各 垂直 行业 发 生 深度 的 融合 。 名 为 Farecast 
的 票 价 预测 工具 就 是 一 个 鲜明 的 例子 。 通 过 对 航班 业务 这 一 垂直 行业 信息 的 深度 挖掘 ， 
它 为 互联 网 的 用 户 提 供 了 能 得 到 最 佳 折扣 的 订 票 时 机 。 作 为 一 个 高 渗透 性 的 行业 ， 互 联 
网 的 发 展 逐 步 向 各 个 分 布 相对 独立 的 垂直 行业 融合 和 汇总 。 原 本 相互 孤立 隐藏 在 各 个 企 
业 数 据 孤 岛 的 信息 ， 被 源源 不 断 地 提取 上 线 。 

社会 化 媒体 、 电 子 商 务 在 大 数据 时 代 的 序幕 下， 已 经 得 到 了 迅猛 的 发 展 。 随 着 互联 
网 其 他 分 支 在 技术 方面 和 经 验 的 成 熟 ， 社 会 化 媒体 也 将 在 大 数据 的 推动 下 进一步 发 展 和 
提升 。 

2. 医疗 的 大 数据 时 代 

(1) 医疗 成 像 与 大 数据 

PACS 影像 、B 超 等 医学 成 像 技 术 的 成 熟 和 发 展 不 仅仅 带 来 了 医疗 水 平 的 提高 ， 人 
们 同时 注意 到 了 在 此 过 程 中 产生 的 大 量 非 结构 化 的 数据 信息 。 不 同 患者 、 不 同人 体 部 
位 和 不 同 专科 影像 数据 ， 由 于 其 离散 的 特性 ， 医 疗 成 像 领域 也 不 可 避免 地 接触 到 了 大 
数据 。 

(2) 药品 开发 与 大 数据 

药品 的 开发 常常 伴随 着 长 时 间 的 病例 分 析 、 药 理论 证 、 临 床 实践 。 在 这 些 可 能 长 达 
数 十 年 的 研发 过 程 中 ， 将 会 在 多 个 层次 产生 大 量 的 数据 。 在 这 些 数 据 基础 上 的 建 模 、 分 
析 、 检 验 也 是 一 个 复杂 而 庞大 的 工作 。 如 何 处 理 这 些 庞大 的 信息 ， 给 大 数据 的 发 展 带 来 
了 新 的 机 遇 和 挑战 。 

(3) 公共 卫生 预防 与 大 数据 

对 于 公共 卫生 部 门 ， 信 息 化 的 建设 可 以 提高 整个 系统 的 应 急 效 率 和 响应 速度 。 通 过 
遍布 在 全 国 的 各 个 医疗 信息 中 心 的 病例 数据 库 ， 快 速 提取 特定 病例 ， 进 行 高 效 的 疫情 监 
测 ， 同 时 将 应 对 措施 反馈 给 各 个 医疗 中 心 。 而 这 一 切 都 将 基于 对 海量 数据 的 可 靠 性 存储 
和 高 效 处 理 。 

3. 科研 的 大 数据 时 代 

随 着 人 类 对 宏观 和 微观 世界 了 解 的 不 断 深 入 ， 以 高 能 物理 、 天 文 观测 、 基 因 组 以 及 
蛋白 组 学 为 代表 的 大 科学 工程 正在 发 生 深刻 的 变化 。 它 们 的 共同 特点 就 是 越 来 越 以 数据 
为 中 心 。 这 些 学 科 带 来 的 数据 规模 令 人 震惊 而 欣喜 ， 前 沿 科学 迫切 需要 用 大 数据 的 技术 
和 工具 进行 分 析 和 处 理 。 

(1) 高 能 物理 与 大 数据 

高 能 物理 研究 中 带 来 的 数目 庞大 的 数据 ， 一 直 持 续 推 动 着 计算 、 网 络 、 存 储 等 大 数 
据 基 础 技术 的 发 展 。 寻 找 西 格 斯 (Higgs) 的 大 型 强 子 对 撞 机 试验 ， 就 是 一 个 典型 的 基于 
大 数据 的 科研 试验 。 

(2) 天 文学 与 大 数据 

随 着 天 文 望远镜 的 逐步 发 展 , 天 文 数据 规 模 的 扩张 尤为 突出 。 以 斯 隆 数 字 巡 天 (Sloan 
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Digital Sky Survey) 项 目 为 例 ， 仅 其 在 新 墨西哥 州 收集 的 数据 就 达到 了 1.4X2^24 字 节 。 
而 据 预 计 ， 在 2016 年 投入 的 智力 全 景 巡 天 望远镜 将 在 5 天 之 内 得 到 同样 多 的 信息 。 

(3) 生物 研究 与 大 数据 

无 论 是 人 类 的 基因 组 ， 还 是 蛋白 质 的 拓扑 结构 ， 生 物 信息 研究 的 发 展 同 大 型 数据 分 
析 密 切 相 关 。 人 类 首次 破解 基因 密码 花 了 前 前 后 后 10 年 的 时 间 。 而 今天 随 着 大 型 数据 处 
BB A ACRE, 基因 仪 平均 15 分 钟 就 能 完成 同样 的 工作 。 大 数据 技术 的 不 断 进步 使 得 生 
物 信息 学 家 正 变 得 野心 勃勃 。 


13.2 大 数据 的 特点 和 要 求 


大 数据 和 传统 数据 集 不 同 ， 它 有 着 鲜明 的 特点 。 这 些 特点 的 存在 ， 对 于 大 数据 系统 
有 着 相应 的 技术 要 求 。 


13.2.1 大 数据 的 特点 


尽管 大 数据 是 一 个 模糊 的 概念 ， 但 是 被 称 为 大 数据 的 信息 集 往往 都 具有 相似 的 特 
点 。 目 前 对 大 数据 特点 的 解读 多 种 多 样 ， 简 单 来 看 ， 它 往往 
都 涵盖 如 图 13-2 所 示 的 几 个 方面 。 

1. Variety ( 数据 类 型 多 样 ) 

现在 产生 数据 的 途径 越 来 越 多 ， 数 量 并 不 仅仅 是 大 数据 
的 唯一 特征 。 以 facebook 播放 一 段 视频 为 例 ， 这 一 简单 的 操 
作 其 实 涉及 了 3 种 主要 的 数据 类 型 : 结构 化 数据 、 半 结构 化 
数据 、 非 结构 化 数据 。 

(1) 用 户 的 相关 评论 : 针对 该 条 视频 的 好 友 评 论 是 最 普 
通 的 文本 数据 。 它 非常 便于 存储 和 后 续 管 理 ， 也 是 人 们 最 熟 
悉 的 数据 类 型 一 一 结构 化 数据 。 它 一 般 以 事务 管理 、 关 系 型 数据 库 核心 字段 、 普 通 文本 
文件 等 形式 出 现 。 

(2) 用 户 的 视频 文件 : 这 类 数据 往往 在 存储 上 占据 着 大 量 的 空间 。 事 实 上 可 以 看 出 ， 
此 类 数据 往往 是 先 有 数据 本 身 ， 之 后 在 此 基础 上 衍生 出 它 的 结构 。 因 此 它 被 称 为 非 结 构 
化 数据 。 它 通常 是 一 些 音频 、 视 频 、 图 片 、 地 理 位 置信 息 等 多 种 多 样 的 形式 。 

(3) Facebook 的 网 页 文件 : 为 了 维护 良好 的 用 户 界 面 ， 网 页 文件 往往 同时 包含 具有 
上 述 两 种 特点 的 数据 。 网 页 会 同时 出 现 文本 数据 以 及 视频 数据 。 对 于 这 种 介 于 文本 数据 
和 视频 数据 之 间 的 数据 , 我们 称 之 为 半 结 构 化 数据 , 它 一 般 是 一 些 网 页 文件 邮件 .HTML、 
报表 、 资 源 库 等 。 

在 大 数据 的 环境 下 ， 往 往 数 据 的 产生 和 管理 并 不 是 针对 某 一 种 数据 类 型 而 言 ， 它 往 
往 是 结构 化 数据 、 非 结构 化 数据 的 综合 体 。 一 个 大 数据 应 用 需要 面 对 的 将 是 多 样 化 的 数 
据 。 这 种 多 类 型 的 数据 对 数据 的 存储 和 处 理 都 提出 了 新 的 要 求 。 

2. Volume (数据 量 大 ) 

大 数据 的 规模 往往 是 它 最 显而易见 的 特点 。 计 算 机 技术 发 展 到 今天 ， 其 数据 规模 的 
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图 13-2 大 数据 的 特点 
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扩张 日 新 月 异 。 

互联 网 公司 几乎 是 要 被 数据 淹没 了 。 谷 歌 公司 每 天 要 处 理 的 数据 量 达到 了 24PB。 
24PB 的 数据 量 是 美国 国家 图 书馆 所 有 纸 质数 据 中 数据 量 的 上 千 倍 ;Facebook 的 用 户 每 
天 上 传 的 照片 超过 1 000 万 张 ,评论 大 约 有 30 亿 条 ; YouTube 每 月 的 访客 达到 8 亿 ;Twitter 
上 的 信息 量 几 乎 每 年 翻 一 番 。 

大 数据 更 是 广泛 存在 于 尖端 科学 领域 。 例 如 ， 一 颗 卫 星 在 使 用 期 间 ， 由 其 产生 的 数 
据 量 将 达到 1PB; 欧洲 强 子 对 撞 机 每 年 将 产生 数 十 PB 的 原始 数据 ， 在 此 基础 上 的 中 间 
数据 和 分 析 结 果 则 更 加 惊人 。 

不 论 是 医学 图 像 处 理 、 高 能 物理 研究 、 天 气 预报 、 勘 探 、 内 容 服 务 、 地 理 信息 这 些 
尖端 领域 ， 还 同 每 个 人 日 常生 活 密切 相关 的 互联 网 应 用 ， 或 是 企业 级 别 的 数据 中 心 ， 海 
量 是 这 些 数 据 集 最 基本 、 最 显著 的 特征 。 

3. Value (价值 密度 低 ) 

人 们 之 所 以 关注 大 数据 ， 是 看 重大 数据 中 的 价值 。 互 联网 大 数据 的 价值 法 则 和 科 
研 大 数据 有 着 显著 的 区 别 。 科 学 的 严谨 性 使 得 每 个 数据 都 具有 重要 的 作用 。 而 在 互联 
网 数据 中 ， 价 值 密度 的 高 低 往 往 与 数据 总 量 的 大 小 成 反比 。 例 如 ， 电 商 公 司 可 能 存储 
着 用 户 大 量 的 搜索 历史 记录 ， 在 这 些 庞大 的 数据 中 ， 事 实 上 与 电 商 利益 相关 的 数据 只 
有 一 两 条 。 

但 通常 而 言 ， 更 大 的 数据 往往 可 能 包含 更 多 的 价值 。 通 过 机 器 算法 来 更 加 有 效 地 从 
数据 中 挖掘 出 真正 有 效 的 内 容 是 大 数据 背景 下 急需 解决 的 难题 。 而 在 男 一 方面 ， 如 何平 
衡 构建 大 数据 的 成 本 和 大 数据 带 来 的 价值 也 是 人 们 不 可 忽视 的 现实 。 一 味 地 增 大 数据 集 
并 不 能 带 来 价值 的 提升 。 

4. Velocity ( 数据 处 理 速 度 快 ) 

大 数据 和 数据 挖掘 都 是 现在 IT 领域 的 热点 问题 。 两 者 具有 很 强 的 相似 性 : 都 是 从 海 
量 的 数据 中 挖掘 出 有 价值 的 信息 。 当 然 两 者 在 数据 规模 上 的 差距 往往 很 明显 。 除 此 之 外 ， 
两 者 还 具有 更 加 鲜明 的 区 别 : 时 效 性 。 

考虑 一 个 电 商 平台 的 情况 ， 当 用 户 对 订单 做 出 修改 之 后 ， 系 统 需要 快速 响应 。 对 订 
单 的 分 析 往 往 被 限制 在 几 个 小 时 之 内 。 如 果 对 数据 的 分 析 结 果 在 第 二 天 才能 得 到 的 话 ， 
那么 库存 部 门将 无 法 及 时 进行 退货 处 理 ， 可 能 会 出 现 暂 时 的 库存 短缺 或 者 拥堵 现象 。 如 
果 响 应 时 间 过 慢 的 话 ， 存 储 下 来 的 数据 也 就 失去 了 分 析 的 价值 和 意义 。 

因此 ， 大 数据 系统 对 时 效 性 的 要 求 更 高 ， 这 既是 大 数据 的 一 个 显著 特征 ， 又 是 和 数 
据 控 掘 的 显著 区 别 。 


13.2.2 ”大 数据 的 核心 技术 


大 数据 系统 包含 与 大 数据 相关 的 方方面面 ， 如 大 数据 的 收集 过 程 、 大 数据 的 存储 过 
程 、 大 数据 的 调用 过 程 和 大 数据 的 处 理 过 程 等 。 这 一 系列 的 操作 会 涉及 众多 的 IT 技术 。 
整个 大 数据 生命 周期 可 以 划分 为 3 个 阶段 : 大 数据 采集 阶段 、 大 数据 预 处 理 阶段 、 大 数 
据 存储 和 处 理 阶 段 。 下 面 讲 解 这 3 个 阶段 中 使 用 到 的 重要 技术 ， 如 图 13-3 所 示 。 

1. 大 数据 采集 技术 

数据 是 指 通过 RFID 射频 数据 、 传 感 器 数据 、 社 交 网 络 交 互 数据 及 移动 互联 网 数据 
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等 方式 获得 的 各 种 类 型 的 结构 化 、 半 结构 化 〈 或 称 之 为 弱 结 构 化 ) 及 非 结构 化 的 海量 数 
据 ， 是 大 数据 知识 服务 模型 的 根本 。 重 点 突破 分 布 式 高 速 高 可 靠 数据 采集 、 高 速 数据 全 
映像 等 大 数据 收集 技术 ; 突破 高 速 数 据 解析 、 转 换 与 装载 等 大 数据 整合 技术 ; 设计 质量 
评估 模型 ， 开 发 数据 质量 技术 。 


p y 





WN 
AN 
ste 


13-3 ”大 数据 技术 流程 图 


大 数据 采集 一 般 分 为 两 个 层次 。 第 一 层 为 大 数据 智能 感知 层 : 主要 包括 数据 传 感 体 
系 、 网 络 通信 体系 、 传 感 适 配 体 系 、 智 能 识别 体系 及 软 硬 件 资源 接 入 系统 ， 实 现 对 续 
构 化 、 半 结构 化 、 非 结构 化 的 海量 数据 的 智能 化 识别 、 定 位 、 信 号 转换 、 传 输 、 管 理 
等 操作 。 

第 二 层 为 处 理 基 础 层 : 主要 涵盖 为 上 层 应 用 提供 虚拟 化 的 服务 器 ， 针 对 结构 化 、 半 
结构 化 和 非 结构 化 数据 的 专用 数据 库 ， 以 及 物 联 网 等 网 络 基础 资源 。 

2. 大 数据 预 处 理 技术 

大 数据 预 处 理 技术 主要 针对 大 数据 采集 技术 接收 到 的 数据 进行 简单 的 加 工 和 处 理 ， 
从 而 提高 后 续 操 作 的 效率 。 这 些 处 理 主要 分 为 两 个 部 分 。 

C1) 抽取 : 由 于 获取 数据 的 来 源 和 产生 背景 不 同 ， 它 们 可 能 具有 多 样 的 结构 和 类 型 。 
数据 抽取 操作 主要 是 将 这 些 复杂 的 数据 转化 为 统一 的 或 者 便于 处 理 的 构 型 ， 从 而 加 速 后 
续 的 分 析 和 处 理 。 

(2) 清洗 : 大 数据 的 价值 不 言 而 喻 ， 然 而 由 前 文 所 述 的 价值 密度 原理 ， 数 据 集 会 包 
含 相 当 一 部 分 的 无 用 数据 ， 甚 至 会 存在 一 些 由 于 采集 中 出 现 的 错误 而 导致 的 干扰 项 。 因 
此 ， 清 洗 操作 会 对 数据 进行 过 滤 ， 保 证 数据 集 的 可 靠 和 有 效 。 

3. 大 数据 存储 及 处 理 技术 

针对 于 大 数据 ， 需 要 用 存储 容量 大 、 扩 展 性 强 的 存储 器 对 采集 到 的 数据 进行 存储 ， 
同时 建立 起 高 效 的 数据 库 来 进行 管理 和 调用 。 其 技术 侧重 点 为 解决 复杂 的 结构 化 数据 、 
半 结 构 化 数据 以 及 非 结构 化 数据 的 管理 与 处 理 。 可 存储 、 可 表示 、 可 处 理 、 可 靠 性 和 有 
效 传输 等 几 个 问题 ， 都 是 大 数据 存储 管理 技术 的 关键 。 

大 数据 的 存储 技术 是 大 数据 应 用 的 基石 ， 因 而 现在 的 主要 技术 热点 是 开发 可 靠 的 分 
MALRA (distributed file systetm，DEFS)， 同 时 对 于 存储 的 能 耗 ， 也 提出 了 存储 不 仅 
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针对 存储 容量 的 提升 ， 也 要 面向 能 效 优化 。 

大 数据 存储 的 下 一 步 操 作 就 是 大 数据 处 理 ， 因 此 在 存储 技术 中 ， 越 来 越 倾向 于 将 计 
算 融 入 存储 ， 典 型 代表 就 是 MapReduce 编程 框架 和 谷歌 文件 系统 (Google file system, 
GFS) 的 融合 。 

由 于 大 数据 的 规模 庞大 ,因此 去 元 余 及 高 效 低 成 本 的 大 数据 存储 技术 相当 关键 。 高 
效 低 成 本 的 存储 能 够 大 幅 提 高 存储 系统 的 容量 ， 可 靠 的 去 元 余 技 术 则 能 够 保 
证 数据 的 质量 。 


(1) 异 构 数据 的 数据 融合 技术 。 对 于 结构 化 数据 、 非 结构 化 数据 和 半 结 构 化 数据 ， 
只 采用 不 同 数据 类 型 分 别处 理 的 操作 不 仅 繁琐 而 且 效 率 低 下 ， 因 此 ， 将 异 构 数据 进行 融 
合 是 今后 大 数据 存储 发 展 的 关键 。 

(2) 大 数据 移动 、 备 份 、 复 制 等 技术 。 由 于 数据 规模 的 原因 ， 大 数据 的 移动 、 备 份 、 
复制 往往 意味 着 很 高 的 开销 。 以 数据 备份 为 例 ， 在 HDFS 中 ， 通 常 采 取 三 重 副本 备份 ， 
整个 系统 有 三 分 之 二 的 存储 容量 都 得 不 到 高 效 的 利用 。 因 此 ， 如 何 高 效 地 对 大 数据 进行 
移动 、 备 份 、 复 制 等 操作 ， 仍 是 值得 深入 研究 的 技术 方向 。 

(3) 开发 大 数据 存储 可 视 化 监控 技术 。 大 数据 相关 的 存储 方案 种 类 繁多 ， 它 们 都 
能 够 在 一 定 场景 中 解决 相关 问题 。 然 而 ， 并 没有 一 个 通用 的 可 视 化 管理 标准 存在 。 对 
大 数据 的 存储 维护 目前 仍 相 当 繁 琐 ， 如 果 存 储 中 出 现 了 问题 ， 可 能 需要 维护 人 员 进 行 
一 系列 操作 才能 找到 问题 的 来 源 ， 因 此 ， 可 视 化 的 监控 技术 将 会 大 幅 缓 解 管理 人 员 的 
压力 。 

源 于 MapReduce 编程 框架 、GFS 和 BigTable 的 存储 系统 已 经 成 为 了 大 数据 处 理 技 
术 的 开拓 者 和 领军 者 ， 源 于 这 三 项 技术 的 Apache Hadoop 等 开源 项 目 则 成 为 了 大 数据 处 
理 技术 的 事实 标准 ， 实 践 已 经 证 明 其 在 PB 量 级 大 数据 处 理 上 的 成 熟 和 可 靠 。 然 而 ， 受 
限于 HDFS 比较 适合 存储 非 结 构 化 数据 和 MapReduce 编程 框架 的 高 延迟 数据 处 理 机 制 ， 
Hadoop 无 法 满足 大 规模 实时 数据 处 理 的 需求 。 

现在 技术 人 员 将 目光 转向 了 开发 新 型 数据 库 技术 ， 以 便于 半 结 构 化 数据 存储 和 处 
理 。 例 如 ， 键 值 存储 系统 、 文 档 存 储 系 统 、 类 BigTable 存储 系统 、HBase 数据 库 系 统 打 
破 了 传统 关系 型 数据 库 对 非 结 构 化 数据 操作 的 瓶颈 ， 同 时 保证 了 处 理 的 即时 性 ， 因 此 可 
以 统称 为 NoSQL 系统 开发 新 型 数据 库 技 术 。 

要 实现 数据 之 间 的 交换 和 处 理 ， 安 全 问题 始终 是 大 数据 必须 考虑 的 。 针 对 大 数据 存 
储 和 处 理 的 模型 ， 分 布 式 访问 控制 、 数 据 审计 技术 、 隐 私 保 护 、 数 据 真 伪 识 别 和 取证 、 
数据 完整 性 验证 等 技术 也 显得 尤为 重要 。 


13.2.3 ”大 数据 和 存储 与 管理 的 技术 要 求 


大 数据 是 近来 的 一 个 技术 热点 ， 然 而 从 Big Data 这 个 名 称 来 看 它 并 不 是 什么 新 颖 的 词 
汇 。 毕 竟 大 数据 仅仅 只 是 个 相对 概念 。 我 们 的 计算 机 系统 已 经 与 数据 存储 打交道 非常 入 了 。 

从 计算 机 的 发 展 史 来 看 ， 数 据 库 、 数 据 仓 库 、 数 据 集 等 信息 管理 领域 的 技术 ， 很 大 
程度 上 都 是 为 了 应 对 大 规模 数据 问题 才 产 生 和 提出 的 。 数 据 仓库 之 父 Bil Inmon FEE 
个 世纪 的 90 年 代 就 已 经 常常 提 及 Big Data. 
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然而 ， 如 前 所 述 ， 互 联网 、 云 计算 、 移 动 和 物 联网 的 迅猛 发 展 ， 使 得 大 数据 更 加 贴 
近 我 们 的 生活 而 不 只 限于 一 个 尖端 部 门 。 无 所 不 在 的 移动 设备 、RFID、 无 线 传感器 分 分 
秒 秒 都 在 产生 大 量 的 数据 ， 上 亿 的 用 户 同 互联 网 服务 时 时 刻 刻 产生 巨 量 的 交互 。 数 据 的 
扩张 比 任 何 一 个 时 代 都 要 迅速 。 

与 此 同时 , 业务 的 发 展 和 IT 企业 的 激烈 竞争 使 得 对 数据 处 理 的 实时 性 、 有 效 性 又 有 
了 新 的 要 求 。 前 述 的 大 数据 的 几 个 特点 使 得 传统 的 数据 处 理 手 段 无 法 应 对 。 大 数据 核心 
技术 中 ， 最 为 重要 的 就 是 大 数据 的 存储 和 管理 过 程 ， 因 此 对 于 大 数据 存储 与 管理 ， 我 们 
有 了 更 新 的 技术 要 求 。 

1. 大 数据 与 分 布 式 存 储 技术 

大 数据 与 分 布 式 存储 技术 主要 包括 : 分 布 式 缓存 、 基 于 MPP 的 分 布 式 数据 库 、 分 
布 式 文件 系统 、 各 式 各 样 的 NoSQL 分 布 式 存储 方案 ， 等 等 。 目 前 火热 的 Cassandra, 
Voldemort 的 存储 系统 都 是 基于 分 布 式 的 解决 方案 。 由 此 不 难看 出 , 分 布 式 的 存储 系统 是 
现在 比较 主流 ， 也 相对 成 熟 的 大 型 数据 存储 系统 解决 方案 。 

(1) CAP 理论 

在 十 多 年 前 ，Eric Brewer 提出 著名 的 CAP 定理 ， 指 出 在 设计 分 布 式 系统 时 ， 一 致 
性 、 可 用 性 、 分 区 容忍 性 3 个 属性 不 可 能 同时 满足 ， 该 定理 
也 叫做 布 鲁 尔 定理 。CAP 定理 明确 了 分 布 式 系统 所 能 实现 系 
统 的 局 限 性 ， 目 前 互联 网 中 的 很 多 分 布 式 系统 是 基于 首要 满 
足 可 用 性 和 分 区 容忍 性 而 设计 的 ， 如 图 13-4 所 示 。 

一 个 分 布 式 系统 最 基本 的 几 个 技术 要 求 也 就 是 CAP E 
理 中 定义 的 一 致 性 (consistent)、 可 用 性 (availability)、 分 区 
容忍 性 (partition tolerance)。 大 数据 系统 希望 在 这 3 个 方面 
都 呈现 出 非常 好 的 性 能 ， 然 而 因为 CAP 定理 的 存在 , 现在 的 
分 布 式 存储 系统 往往 只 能 较 好 地 实现 其 中 的 两 者 。 

O 一 致 性 :所 有 在 分 布 式 系统 上 的 操作 有 一 个 总 体 的 顺 
序 ， 每 一 个 操作 看 起 来 就 像 是 在 一 个 单独 的 瞬间 完成 的 。 这 就 要 求 分 布 式 系统 的 运行 就 
像 是 在 一 个 单 节点 上 一 样 ， 在 一 个 时 间 响 应 一 个 操作 。 

@ 可 用 性 : 对 于 一 个 可 用 性 的 分 布 式 系 统 ， 每 一 个 非 故 障 的 节点 必须 对 每 一 个 请 
求 做 出 响应 ,也 就 是 , 该 系统 使 用 的 任何 算法 必须 最 终 终 止 。 当 同时 要 求 分 区 容忍 性 时 ， 
这 是 一 个 很 强 的 定义 : 即使 是 严重 的 网 络 错误 ， 每 个 请 求 也 必须 终止 。 

@ 分 区 容忍 性 : 为 了 定义 分 区 容忍 性 ， 假 定 网 络 满足 如 下 条 件 : 网 络 可 能 丢失 从 
一 个 节点 发 往 另 一 个 节点 的 任意 消息 ， 当 网 络 被 分 区 〔〈 隔 断 ) 时， 所 有 从 一 个 分 区 的 节 
所 发 往 男 一 个 分 区 的 消息 将 会 丢失 。 一 致 性 要 求 每 个 响应 必须 是 一 致 的 ， 即 使 系统 内 部 
的 消息 没有 被 正确 地 发 送 。 可 用 性 要 求 从 客户 端 接收 请 求 的 任 一 节点 必须 被 响应 ， 即 使 
任意 的 消息 可 能 没有 被 正确 地 发 送 。 

(2) CAP 理论 应 用 

由 于 这 个 定理 的 存在 ， 对 于 不 同 的 系统 关注 点 ， 人 往往 会 采取 不 同 的 策略 来 尽 可 能 实 
现 其 中 的 两 者 ， 同 时 尽量 将 第 三 者 的 性 能 控制 在 合理 的 范围 之 内 。 只 有 真正 理解 了 系统 
的 需求 ， 才 有 可 能 利用 好 CAP 定理 。 





图 13-4 CAP 定理 图 解 
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一 般 有 两 个 方 同 来 利用 CAP 理论 。 

1) 键 - 值 (key-value) 存储 ， 如 Amazon Dynamo 等 ， 可 以 根据 CAP 理论 灵活 选择 
不 同 倾 疝 的 数据 库 产 品 。 

2) 领域 模型 + 分 布 式 缓存 + 存储 ， 可 根据 CAP 理论 结合 自己 的 项 目 定制 灵活 的 分 布 
式 方 案 ， 但 难度 较 高 。 

对 于 大 型 网 站 ， 可 用 性 与 分 区 容忍 性 的 优先 级 要 高 于 数据 一 致 性 ， 一 般 会 尽量 朝 着 
A、P 的 方向 设计 ， 然 后 通过 其 他 手段 保证 对 一 致 性 的 商务 需求 。 

不 同 的 数据 对 一 致 性 的 要 求 是 不 同 的 。SNS 网 站 可 以 容忍 相对 较 长 时 间 的 不 一 致 ， 
而 不 影响 交易 和 用 户 体 验 ; 而 像 支 付 宝 这 样 的 交易 和 账 务 数据 则 是 非常 敏感 的 ， 通 常 不 
能 容忍 超过 秒 级 的 不 一 致 。 

(3) 突破 CAP 定理 

随 厦 技术 的 发 展 ， 越 来 越 多 的 工程 人 员 开 始 了 对 CAP 定理 的 突破 ， 希 望 同时 满足 
CAP 的 3 个 要 素 ， 其 中 的 主要 问题 集中 在 以 下 儿 个 方面 。 

D 扩展 数据 模型 ， 文 持 批 量 写 和 随机 读 。 不 是 每 一 个 应 用 程序 都 支持 键 - 值 存储 的 
数据 库 ， 将 分 布 式 计 算 模型 如 何 同 常 规程 序 结合 起 来 是 突破 CAP 定理 的 难点 。 

2) 更 好 的 批 处 理 原 语 : Hadoop 由 于 其 在 商业 上 的 成 熟 和 开源 而 被 各 大 IT 公司 广泛 
接纳 ， 然 而 它 并 不 是 进行 批 处 理 的 最 终 形态 。 很 多 批 处 理 计算 Hadoop 效率 不 高 〈 如 对 
大 量 小 文件 的 批 处 理 行为 ) 。 

3) 提升 后 的 读 写 NoSQL 数据 库 。 不 同类 型 数据 的 数据 库 还 有 很 大 的 提升 空间 ， 随 
着 这 些 数据 库 的 成 熟 ， 它 们 将 收获 很 多 。 

4) 高 层级 的 抽象 。 对 批 处 理 模块 和 实时 处 理 模 块 的 高 层次 抽象 ， 在 批 处 理 和 实时 
架构 下 一 个 简单 的 、 描 述 性 的 、 可 靠 性 好 的 语言 显得 尤为 重要 。 

截止 到 目前 ， 对 分 布 式 系统 性 能 的 拓展 仍 在 不 断 进行 。 尽 管 有 些 系统 在 这 三 者 上 都 
有 了 些 性 能 提升 ， 但 往往 随 之 而 来 的 是 系统 的 高 度 复 杂 ， 使 得 维护 变 得 困难 重重 。 

2. 针对 大 数据 特点 的 新 要 求 

除了 CAP 中 的 3 个 基本 要 求 外 , 现在 的 大 数据 系统 根据 自己 的 业务 需求 , 对 系统 提 
出 了 更 新 的 技术 要 求 ， 主 要 包括 以 下 几 个 方面 。 

C1) 更 高 的 性 能 要 求 

由 于 大 数据 的 任务 不 只 是 简单 的 存储 ， 还 包含 后 续 的 计算 分 析 等 诸多 工作 ， 系 统 的 
读 写 和 支持 计算 的 能 力也 必须 加 强 。 

对 于 一 个 分 布 式 系统 而 言 ， 当 一 个 计算 任务 被 分 配 到 系统 集群 式 时 ， 各 个 计算 节点 
将 首先 从 IO 模块 读 取 数 据 ， 之 后 计算 ， 最 后 再 写 回 IO 节点 。 在 这 个 过 程 当中 ， 计 算 
的 开始 和 结束 阶段 将 对 系统 的 IO 性 能 提出 很 高 的 要 求 。 

图 13-5 是 一 个 实际 分 布 式 数据 存储 和 处 理 系统 的 文件 吞吐 量 界面 ， 从 该 图 可 以 看 
出 ， 每 个 节点 上 统计 出 来 的 吞吐 量 。 

不 同 节点 对 吞吐 量 的 需求 不 尽 相 同 ， 最 高 的 可 能 达到 2Gbit/s 左右 ， 总 吞吐 量 达 到 
9Gbit/s。 常 规 的 文件 系统 由 于 采取 了 集中 的 资源 分 配 模式 ， 往 往 导致 存储 系统 的 单 点 故 
障 对 系统 性 能 的 显著 影响 。 同 时 ,， 当 系统 扩展 到 一 定 的 规模 时 , 会 产生 性 能 瓶颈 以 及 Hot 
Spot 问题 。 
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与 此 同时 ， 如 何 分 配 各 个 节点 的 缓存 资源 ， 尽 可 能 降低 访问 磁盘 带 来 的 性 能 损耗 也 
是 同样 需要 考虑 的 问题 。 

不 论 是 VO 模块 、 缓 存 利 用 ， 还 是 资源 分 配 ， 大 数据 系统 对 整个 存储 以 及 计算 都 提 
出 了 更 高 的 性 能 要 求 。 

(2) 更 强 的 并 发 处 理 能 力 

对 于 大 数据 处 理 系统 ， 存 储 模 块 往往 是 制约 整个 系统 应 用 性 能 的 关键 因素 。 虽 然 存 
储 模块 的 容量 提升 和 单位 存储 能 力 成 本 的 下 降 趋 势 明 显 ， 但 是 传统 的 存储 技术 架构 对 于 
存 取 带 宽 的 提高 却 非常 昂贵 和 困难 。 当 数据 量 较 大 时 ，LIO 读 写 部 分 占用 的 整个 数据 处 
理 时 间 非 常 可 观 ， 往 往 是 整个 集群 系统 的 性 能 瓶颈 。 如 何 使 存 取 能 够 在 系统 中 更 好 地 并 
发 ， 增 加 整个 系统 的 并 发 VO 读 取 能 力 ， 实 现 高 速 并 行 存 取 ， 是 大 数据 时 代数 据 中 心 面 
临 的 关键 性 问题 。 

一 个 大 规模 的 数据 系统 ， 往 往 不 只 服务 一 个 用 户 ， 企 业内 部 的 数据 中 心 很 可 能 被 财 
务 部 门 、 人 事 部 门 、 后 勤 部 门 、 销 售 部 门 同时 访问 。 为 了 提高 整体 的 系统 访问 效率 ， 如 
何 并 发 处 理 各 个 不 同 的 用 户 请 求 ， 也 是 对 现在 大 数据 系统 的 新 要 求 。 

(3) 更 好 的 拓展 性 

IT 业务 的 扩展 往往 非常 迅速 ， 新 创 公 司 的 存储 节点 很 可 能 每 天 都 会 增加 数 十 个 。 由 
于 大 数据 往往 采用 分 布 式 系统 ， 对 其 节点 的 扩展 往往 不 是 那么 简易 。 然 而 ， 由 于 节点 扩 
张 是 大 数据 系统 的 常态 ， 因 此 升级 扩展 性 能 也 是 衡量 大 数据 系统 的 重要 指标 。 同 时 ， 由 
于 磁盘 的 异 构 型 ， 如 何 使 异 构 的 磁盘 阵列 能 够 简单 地 添加 并 迅速 融入 系统 进行 工作 也 是 
新 颖 的 问题 。 

对 于 大 数据 系统 而 言 ， 节 点 的 多 样 性 不 仅仅 表现 在 磁盘 的 异 构 上 ， 更 大 的 计算 节点 
也 可 能 具有 不 同 的 形态 。 例 如 ， 主 要 负责 存储 提供 数据 的 存储 节点 和 提高 整体 计算 性 能 
的 性 能 加 速 节 点 在 结构 上 的 区 别 非常 明显 。 针 对 不 同 的 磁盘 、 不 同 的 节点 进行 系统 拓展 
将 会 使 大 数据 系统 变 得 更 加 灵活 ， 富 有 弹性 。 

(4) 更 强 的 安全 性 

传统 存储 系统 扩展 时 , 在 规模 尚 小 时 适用 的 技术 在 规模 较 大 时 变 得 不 再 适用 , RAID 
就 是 最 好 的 例子 。 只 有 在 发 生男 一 起 故障 前 重新 构建 数据 时 ，RAID 才 有 效 。 但 是 ， 数 
据 量 增加 时 ， 访 问 该 数据 的 速度 并 未 提高 ， 发 生 其 他 故障 的 可 能 性 仍 会 增加 。 
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如 何 实现 大 规模 数据 的 存储 安全 , 同时 尽 可 能 保证 数据 的 读 写 性 能 是 对 大 数据 系 
统 提 出 的 新 要 求 。 目 前 主流 的 架构 默认 采取 元 余 方 式 保 证 系统 的 安全 性 。 例 如 在 
Hadoop 分 布 式 文 件 系统 (hadoop distributed File System, HDFS) F, 每 个 数据 节点 (data 
node) 将 会 有 两 个 备份 节点 ， 当 某 个 磁盘 数据 损坏 时 ， 可 以 从 另外 两 个 磁盘 中 恢复 其 
数据 。 

然而 ， 这 样 做 的 缺陷 显而易见 。 它 会 降低 整个 系统 的 存储 效率 ， 显 著 提高 成 本 ， 同 
时 ， 对 数据 的 恢复 将 会 消耗 大 量 的 内 部 VO 资源 。 对 于 大 规模 磁盘 阵列 ， 数 据 损 坏 丢 失 
是 一 个 和 常态， 因此， 由 此 引发 的 性 能 降低 将 非常 明显 。 

如 何在 维护 好 存储 安全 性 的 同时 ， 不 降低 系统 的 性 能 并 尽 可 能 节省 开支 ， 依 然 是 有 
待 满足 的 要 求 。 

(5) 更 方便 的 管理 维护 

在 设计 高 性 能 存储 系统 时 ， 还 有 一 点 也 需要 考虑 ， 那 就 是 系统 的 维护 工作 。 由 于 
目前 的 大 数据 存储 系统 广泛 建立 在 分 布 式 存储 基础 之 上 ， 为 了 确保 大 量 集群 节点 的 
工作 状态 ， 需 要 的 管理 模块 使 管理 人 员 时 时 刻 刻 都 能 够 获取 集群 或 整个 系统 的 运行 
状态 。 

而 一 旦 发 现 了 错误 的 产生 之 后 ， 对 节点 的 定位 和 维护 同样 要 变 得 更 加 高 效 。 与 此 同 
时 ， 系 统 的 升级 、 备 份 、 补 丁 的 更 新 等 操作 ， 都 尽 可 能 变 得 简单 、 快 捷 。 


13.3 ”存储 系统 如 何 应 对 大 数据 


随 着 大 数据 的 造 勃 发 展 ， 大 数据 已 经 衍生 出 了 自己 独特 的 架构 ， 随 之 而 来 的 是 一 些 
sr PWIA: hadoop. openstack, NoSQL, HBase. GFS, HDFS 等 ， 这 一 切 也 直接 推动 
了 存储 、 网 络 的 发 展 。 处 理 大 数据 是 整个 IT 行业 的 新 挑战 。 

事实 上 ， 人 硬件 的 发 展 最 终 还 是 由 软件 需求 推动 的 。 从 历史 的 角度 而 言 ， 大 型 3D 游 
戏 的 和 贰 勃发 展 ， 催 生 了 显卡 业 的 一 次 次 新 生 ， 甚 至 Windows 的 不 断 更 新 ， 也 在 催促 硬件 
向 前 进步 。 

时 至 当下 ， 我 们 可 以 很 明显 地 看 出 ， 大 数据 分 析 应 用 需求 正在 影响 数据 存储 基础 设 
施 的 不 断 发 展 。 从 这 个 角度 来 说 ， 这 一 变化 对 存储 厂商 是 一 个 巨大 的 历史 契机 。 

伴随 着 结构 化 数据 、 非 结构 化 数据 以 及 半 结 构 化 数据 的 持续 增长 和 分 析 数 据 来 源 的 
多 样 性 ， 之 前 的 存储 系统 已 经 无 法 满足 大 数据 应 用 的 需求 。 存 储 系统 必须 通过 修改 基于 
块 和 文件 的 存储 架构 来 适应 这 些 新 要 求 。 下 面 将 讨论 大 数据 存储 基础 设施 相关 的 属性 ， 
并 分 析 存 储 系统 如 何 迎 接 大 数据 的 挑战 。 

l. 容量 的 应 对 

大 数据 的 容量 将 会 达到 PB 级 ， 由 此 带 来 的 不 仅仅 是 存储 模块 数量 的 增加 ， 更 对 其 
拓展 能 力 提出 了 新 的 要 求 。 通 过 简单 的 增加 模块 或 者 磁盘 柜 ， 就 能 够 达到 增加 容量 的 目 
的 ， 甚 至 在 此 过 程 中 尽量 不 停机 《〈 实 时 大 数据 系统 的 停机 代价 非常 大 )。 

解决 方案 : 目前 的 发 展 趋势 抛弃 了 之 前 传统 存储 系统 的 烟 和 办 式 架构 ， 横 癌 扩 展 
《Scale-out) 架构 的 存储 系统 越 来 越 为 人 们 所 重视 。 它 的 特点 是 ， 每 个 节点 除了 具有 存 
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储 容量 之 外 ， 往往 会 具有 一 些 简单 的 数据 处 理 能 力 ， 同 时 能 够 互 连 系 统 中 的 其 他 设备 ， 
进行 机 架 沟 通 。 人 们 和 希望 通过 Scale-out 架构 ， 实 现 平滑 无 缝 地 拓展 ， 并 避免 存储 孤岛 
出 现 。 

2. 元 数据 管理 的 应 对 

大 数据 不 仅仅 表现 在 单个 文件 的 规模 巨大 ， 还 意味 着 ， 大 数据 将 具有 海量 的 文件 数 
量 。 针 对 文件 的 诸多 操作 将 会 带 来 文件 系统 逐渐 积累 的 元 数据 。 如 果 对 于 元 数据 的 管理 
处 ” 理 不 当 的 话 ， 会 显著 影响 系统 的 拓展 能 力 和 性 能 ， 这 也 正 是 传统 的 NAS 文件 系统 
的 性 能 瓶颈 。 

解决 方案 : 基于 对 象 的 存储 架构 似乎 是 这 一 问题 的 解决 方案 。 它 能 够 管理 10 亿 级 
别 的 文件 数量 ， 同 时 可 以 避免 传统 存储 中 出 现 的 元 数据 管理 难题 。 基 于 对 象 的 存储 架构 
同时 具有 广 域 扩展 能 力 ， 它 可 以 很 方便 地 在 不 同 的 地 点 部 署 不 同 数目 的 数据 节点 ， 进 而 
组 成 一 个 个 路 区 域 的 大 型 存储 基础 系统 。 

3. 实时 响应 的 应 对 

大 数据 的 特征 之 一 就 是 快速 ， 也 就 是 时 效 性 。 这 一 特点 在 涉及 网 上 交易 或 者 金融 平 
台 时 尤为 突出 。 这 也 就 要 求 存储 系统 必须 能 在 支持 用 户 操作 的 同时 ， 保 持 较 高 的 响应 
速度 。 

解决 方案 : 在 这 种 场景 中 ，Scale-out 架构 的 存储 系统 具有 显著 的 优势 。 由 于 其 每 一 
个 节点 都 具有 处 理 和 互联 组 件 ， 因 此 可 以 通过 增加 存储 节点 和 性 能 提高 节点 ， 解 决 两 方 
面 的 问题 : 容量 和 响应 速度 。 在 节点 规模 扩大 的 同时 ， 整 个 系统 的 处 理 能 力也 有 了 提高 ， 
为 实时 响应 提供 了 必要 的 支持 。 

基于 对 象 的 存储 系统 ， 则 可 以 通过 支持 并 发 的 数据 流 来 提高 数据 的 吞吐 量 和 存储 系 
统 的 啊 应 时 效 。 

4. 高 IOPS (Input/Output Per Second ) 的 应 对 

大 数据 的 应 用 场景 非常 广泛 , 在 某 些 场景 下 , 对 系统 的 IOPS 性 能 有 很 高 的 要 求 (如 
高 性 能 计算 ) 。 而 虚拟 化 的 广泛 使 用 也 使 得 IOPS 的 提高 迫在眉睫 。 

解决 方案 : 为 了 应 对 这 些 新 的 挑战 ， 各 种 模式 的 固态 存储 设备 随 之 产生 ， 对 于 小 型 
系统 而 言 ， 在 服务 器 内 部 增加 高 速 缓存 就 能 很 好 地 满足 需求 。 而 对 于 大 型 系统 而 言 ， 往 
往 需 要 扩展 全 固态 介质 的 存储 系统 。 

5. 并 发 访问 的 应 对 

在 了 解 到 大 数据 分 析 背 后 的 潜在 价值 之 后 ,IT 企业 将 会 将 更 多 数据 集 纳 入 系统 进行 
分 析 ， 同 时 将 会 让 更 多 的 用 户 或 者 企业 共享 大 数据 。 为 了 创造 更 多 的 价值 ， 企 业 将 会 逐 
步 扩大 使 用 大 数据 集群 的 用 户 数量 ， 而 由 此 将 带 来 并 发 访问 的 一 系列 问题 。 

解决 方案 : 全 局 文件 系统 可 以 允许 多 个 主机 上 的 多 个 用 户 并 发 式 地 访问 文件 数据 ， 
一 个 集中 的 访问 权限 控制 系统 , 将 使 整个 系统 有 条 不 紊 地 运行 ,而 多 个 用 户 访问 的 数据 ， 
可 能 集中 在 不 同 地 点 、 不 同类 型 的 存储 设备 上 。 

6. 安全 问题 的 应 对 

安全 性 问题 一 直 是 大 数据 的 短 板 。 金 融 数 据 、 医 疗 信息 数据 、 政 府 情 报 统计 数据 往 
往 都 有 严格 的 安全 标准 和 保密 分 级 。 但 是 对 于 IT 公司 来 说 , 行业 上 缺少 一 个 强 有 力 并 且 
广泛 事实 的 安全 性 标准 。 在 过 去 由 于 信息 的 交互 往往 较 少 发 生 ， 因 此 整个 业内 对 安全 标 
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准 的 制定 往往 有 声 而 无 力 。 

解决 方案 : 在 当下 ， 大 数据 的 分 析 往 往 需 要 多 类 数据 相互 参考 ， 数 据 混合 使 得 安全 
性 问题 变 得 尤为 突出 。 未 来 的 发 展 将 会 催生 出 一 个 新 的 安全 性 标准 ， 在 此 基础 上 ， 存 储 
系统 将 进行 相应 的 调整 和 改善 。 

7. 成 本 问题 的 应 对 

成 本 问题 在 当下 变 得 越 来 越 严 重 ， 业 务 的 拓展 使 得 存储 系统 变 得 越 来 越 庞大 ， 而 对 
于 初创 公司 而 言 ， 在 前 期 存储 上 的 投入 往往 是 令 人 头疼 的 问题 :一 次 性 购置 大 量 的 存储 
设备 往往 带 来 成 本 的 负担 ， 而 如 果 搭 建 的 系统 规模 较 小 ， 可 能 需要 面 对 后 续 升 级 拓展 的 
一 系列 困难 。 

解决 方案 : 控制 成 本 一 方面 是 提高 单位 存储 系统 的 存储 效率 ， 同 时 尽量 减少 那 
些 昂 贵 部 件 的 比重 。 重 复数 据 删 除 系统 现在 已 经 开始 走向 存储 市 场 。 而 对 于 大 数据 
而 言 ， 由 于 数据 的 多 样 化 ， 使 得 数据 的 删除 更 加 复杂 。 同 时 ， 为 了 保证 数据 的 可 靠 
性 ， 存 储 校 验 以 及 恢复 能 力 的 提升 同样 可 以 提高 存储 效率 。 这 既是 挑战 ， 也 是 存储 
系统 的 机 遇 。 

另 一 方面 ， 降 低 维 护 系统 所 需 的 开销 。 减 少 存储 的 能 源 消耗 ， 哪 怕 十 几 个 百分点 ， 
往往 也 能 获得 明显 的 回报 。 

对 于 长 期 性 的 数据 ， 归 档 往往 能 将 存储 规模 控制 在 一 个 可 以 接受 的 范围 之 内 。 从 成 
本 上 来 看 ， 磁 带 是 归档 数据 的 最 佳 存储 介质 。 在 大 数据 时 代 ， 依 旧 如 此 。 支 持 TB 级 的 
大 容量 归档 系统 能 够 显著 降低 历史 数据 的 维护 成 本 。 

成 本 当中 最 大 的 一 部 分 是 商业 化 的 硬件 设备 。 因 此 AMC 的 模式 很 值得 借鉴 。 通 过 
定制 自己 的 “硬件 平台 ”而 不 是 购置 实体 的 硬件 设备 ， 可 以 方便 地 对 它们 的 业务 扩展 成 
本 进行 有 力 的 控制 。 为 了 适应 这 个 发 展 趋势 ， 存 储 系 统 将 会 变 得 更 加 虚拟 化 ， 向 软件 
服务 模式 的 方向 发 展 。 软 硬 一 体 化 的 存储 系统 将 显著 降低 企业 级 别 的 数据 存储 的 整体 
价格 。 

长 时 效 数据 的 优化 存储 。 数 据 的 累积 是 影响 成 本 的 重要 部 分 。 对 于 不 同 的 应 用 场景 
来 说 ， 尽 管 有 些 数据 的 使 用 频率 很 少 ， 但 是 法 律 法 规 或 者 个 人 用 户 的 习惯 ， 将 会 使 存储 
系统 不 得 不 对 这 些 历史 数据 进行 专项 化 的 处 理 〈 如 病 患 的 历史 病例 或 者 公司 的 历史 财务 
信息 ) 。 而 由 于 数据 的 分 析 具 有 时 效 性 ， 如 何 对 那些 失去 时 效 性 的 数据 进行 数据 迁移 并 
保证 数据 的 可 靠 性 ， 也 是 控制 存储 成 本 的 一 个 策略 。 存 储 系统 针对 历史 数据 和 热点 数据 
的 异化 存储 将 会 降低 整个 系统 的 成 本 和 开销 。 

8. 灵活 性 的 应 对 

大 规模 存储 系统 的 基础 设施 往往 规模 庞大 。 因 此 在 最 初 的 设计 和 架构 上 必须 考虑 到 
今后 针对 不 同业 务 的 多 变性 ， 使 其 能 够 适应 分 析 程 序 的 改变 而 扩展 。 一 个 大 型 的 数据 存 
储 设施 一 旦 投入 使 用 ， 调 整 的 成 本 就 会 很 高 ， 因 此 存储 系统 必须 灵活 应 对 各 种 应 用 和 数 
据 场景 。 

解决 方案 : 现在 的 存储 系统 不 能 再 只 针对 某 一 种 数据 类 型 ， 更 需要 对 结构 化 、 非 结 
构 化 和 半 结 构 化 数据 都 提供 高 效 存 储 。 同 时 ， 越 来 越 多 的 存储 系统 采取 了 分 布 式 方案 ， 
也 能 够 提高 系统 的 灵活 性 。 
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13.4 ”华为 针对 大 数据 存储 的 实践 与 应 用 


华为 对 于 大 数据 存储 和 处 理 做 出 了 积极 的 贡献 ， 聚 焦 于 提供 创新 的 存储 技术 和 架 
构 ， 力 争 更 好 地 完成 海量 数据 的 存储 和 处 理工 作 。 


13.4.1 华为 OceanStor 9000 


l. 产品 定位 

随 着 物 联网 、 社 交 化 、BYOD 等 技术 的 广泛 应 用 ， 数 据 呈 现 爆 炸 性 增长 。 这 不 仅 对 
存储 的 性 能 及 容量 提出 苛刻 考验 ， 还 要 求 具 备 快 速 的 数据 检索 与 分 析 能 力 以 及 时 获取 关 
键 价 值 信息 ， 同 时 活跃 数据 归档 需要 更 加 简便 、 上 有 具有 成 本 效益 的 存储 方案 。 美 国 市 场 研 
究 公 司 IDC 认为 “在 可 预见 的 未 来 , 存储 是 大 数据 和 分 析 领 域 最 大 的 基础 设施 开 文 之 一 。 
华为 OceanStor 9000 基于 “三 位 一 体 ” 的 创新 理念 ， 融 存储 、 分 析 、 归 档 于 一 体 ， 采 用 
新 一 代 Scale-out 架构 ， 实 现 数据 全 生命 周期 管理 ， 帮 助 用 户 从 容 面 对 大 数据 挑战 。” 除 
此 之 外 ，OceanStor 9000 向 客户 提供 超过 500 万 的 OPS, Mit 170GB 的 系统 总 带宽 , FE 
分 满足 HPC、 生 命 科 学 、 媒 体 编 辑 、 卫 星 测 绘 以 及 数据 中 心 集 中 存储 、 互 联网 运营 等 多 
种 大 数据 业务 应 用 的 高 性 能 要 求 。 

2. 价值 特点 

华为 OceanStor 9000 系统 融合 了 Scale-out NAS. Scale-out Database 和 Scale-out 
Backup， 实 现 多 位 一 体 ， 是 面向 大 数据 存储 的 集群 存储 系统 。OceanStor 9000 在 一 个 系 
统 内 实现 了 分 布 式 存储 、 分 布 式 备份 以 及 分 布 式 数 据 分 析 的 一 体 化 全 生命 周期 管理 ， 在 
数据 统一 调度 模块 的 调度 下 ， 数 据 在 多 域 间 有 效 流动 。OceanStor 9000 系统 采取 分 布 式 
架构 ， 系 统 在 初始 时 可 以 使 用 较 小 的 配置 ， 降 低 CAPEX 开销 ， 随 着 业务 量 的 增加 ， 客 
户 可 以 方便 扩容 ， 以 实现 应 需 而 变 。 

在 扩展 方面 ， 华 为 OceanStor 9000 采用 全 对 称 分 布 式 Scale-Out 架构 ， 全 了 元 余部 署 ， 
无 单 点 故障 ， 分 布 式 Raid 保证 数据 节点 间 高 可 靠 。 在 保证 数据 高 可 靠 的 同时 ， 系 统 支 持 
3 一 288 节点 弹性 无 颖 扩展 ， 单 一 文件 系统 可 扩容 至 100PB， 整 个 扩容 过 程 业 务 无 中 断 ， 
这 一 点 在 关键 应 用 方面 至 关 重 要 。 

企业 ， 尤 其 是 新 兴 的 企业 ， 在 起 步 阶段 ， 业 务 量 不 大 ， 需 要 的 IT 设施 规模 也 不 大 ， 
更 不 可 能 有 大 手笔 的 IT 预算 ， 但 对 性 能 方面 的 要 求 可 能 还 很 高 。 华 为 OceanStor 9000 
系统 的 起 步 配 置 可 以 以 低 的 TCO， 满 足 企 业 在 容量 和 性 能 方面 的 需求 ; 随 着 企业 发 展 壮 
大 ， 对 IT 的 需求 也 在 不 断 攀 升 ， 这 时 仅 需 简单 地 扩容 OceanStor 9000 系统 ， 便 能 够 实现 
对 存储 空间 和 性 能 的 扩充 ， 满 足 更 高 需求 。 

在 管理 方面 ， 华 为 OceanStor 9000 只 需 一 个 管理 系统 ， 即 可 对 硬件 、 软 件 、 网 络 、 服 
务 统一 管理 ， 统 一 的 界面 让 管理 更 加 简单 。 单 一 文件 系统 、 统 一 命名 空间 、 自 动 精简 配置 等 
特性 ， 可 以 有 效应 对 空间 规划 ， 当 出 现 硬 盘 预 警 时 ， 系 统 可 快速 自 愈 合 ， 让 维护 更 便捷 。 

3. 关键 特性 

C1) ERTER: 世界 上 最 快 的 NAS 系统。 
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(2) 弹性 空间 : 业界 最 大 单一 文件 系统 。 

(3) 数据 可 靠 : 最 大 95% 的 磁盘 利用 率 。 

(4) 简化 管理 : 统一 视图 、 统 一 管理 。 

OceanStor 9000 与 现 有 产品 性 能 的 对 比如 图 13-6 所 示 。OceanStor 9000 的 单 节 点 带 
宽 可 以 达到 800MB/s( 物 理 带 宽 1000MB/s， 按 8+2 去 除 见 余数 据 之 后 为 800MB/s)， 其 
系统 带宽 可 达 200GB (按照 每 节点 800MB/s，288 节点 线性 系数 0.9 计算 )， 并 且 OceanStor 
9000 的 拓展 性 能 非常 强大 ， 整 个 系统 的 性 能 随 节 点 数 线性 增长 。 


HUAWEI 
500 J + 


SPEC NFS 










HUAWEI 


3064602 
SPEC NFS 
24 节点 


EMC] 
1112705 
2.54ms 


数据 摘自 : http: //www.spec.org/sfs2008/results/s fs2008n fs. html 
图 13-6 OceanStor 9000 与 现 有 产品 性 能 对 照 柱状 图 


4. 软 硬 件 形态 和 组 件 

OceanStor 9000 的 整体 逻辑 架构 如 图 13-7 Aras. 

OceanStor 9000 的 软件 层次 如 图 13-8 所 示 。 

Hp; 

。 NFS/CIF 集群 负责 NAS 协议 。 

© CA 负责 文件 系统 协议 的 语义 解析 执行 ， 是 文件 系统 业务 发 动机 。 

。 MDS 管理 文件 系统 的 元 数据 ， 可 以 定义 为 文件 系统 元 数据 的 读 写 缓存 。 

。 MDS 集群 不 同 节点 按照 子 树 切割 ， 相 互 不 重叠 ， 考 虑 负载 均衡 、 扩 展 性 、 可 靠 
性 ， 提 供 子 树 迁 移 能 力 。 

。 DS 集群 提供 可 靠 的 对 象 存储 ; 为 文件 系统 元 数据 和 文件 数据 提供 存储 能 力 ; DS 
集群 提供 差异 化 的 数据 元 余 保 护 能 力 。 

e Monitor 集群 具有 系统 的 集群 状态 监控 和 状态 表格 同步 ， 以 及 可 靠 保 存 的 能 力 。 
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图 13-7 OceanStor 9000 逻辑 架构 
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4] 13-8 OceanStor 9000 软件 层次 
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。 CMS 集群 对 集群 的 物理 节点 进行 设备 管理 ， 提 供 配置 、 告 警 、 日 志 、 升 级 
能 力 。 

e ISM 为 OceanStor 9000 提供 配置 、 告 警 等 UI 界面 。 

5. 典型 应 用 场景 

C1) 电视 台 非 线 编 和 媒 资 管理 系统 

O 应 用 需求 : 收录 系统 需要 可 靠 的 存储 来 储存 卫星 传 回 的 数据 ; 非 线 编 系 统 需 要 
高 性 能 的 存储 来 快速 制 编 ， 媒 资 管理 系统 (MAM) 需要 大 容量 、 低 成 本 的 存储 来 储存 历 
史 资 料 ， 数 据 共 享 需求 。 

D 解决 方案 的 特点 

。 N+ 到 N+4 业界 最 高 水 平 的 数据 可 靠 性 。 

。 弹性 扩展 ， 高 达 40PB 线性 扩展 。 

。 非 热 点 数据 上 自动 迁移 ， 节 省 投资 成 本 。 

。 单一 文件 系统 ， 满 足 数据 共享 要 求 。 

电视 台 非 线 编 和 媒 资 管理 系统 结构 图 如 图 13-9 所 示 。 





| 非 线性 编辑 
i | 

| 编辑 ”特效 ”合成 

1 ¥ ; 

| 

高 清 : 200Mbit/s | 

标清 : 50Mbit/s | 








OceanStor 9000 


一 一 一 一 一 一 一 一 一 一 一 一 


图 13-9 ”电视台 非 线 编 和 媒 资 管理 系统 结构 图 


(2) HPC 应 用 场景 一 一 卫星 测绘 

O 应 用 需求 : 存储 大 文件 (GB 一 10GB 级 ) 和 小 文件 (KB 级 ) 并 存 ， 大 文件 读 写 
( 单 文件 可 达 200GB); 每 天 产生 TB 级 的 数据 ， 存 储 总 量 为 PBR; 生成 图 像 产 品 时 批 
量 作 业 ， 要 求 存储 高 吞吐 ， 原 始 数据 不 允许 丢失 。 

D 解决 方案 的 特点 

e 5 000 000+ OPS 业界 性 能 第 一 ， 应 对 每 天 产生 的 大 量 图 片 存 储 需 求 。 
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数据 动态 分 级 ， 存 储 访问 效率 提升 5 倍 。 
3 一 288 节 所 超大 线性 扩展 能 力 ， 业 务 持续 增长 轻松 扩容 。 


卫星 测绘 系统 图 如 图 13-10 所 示 。 


13.4.2 





H A We cE a 


OceanStor 9000 


图 13-10 “卫星 测绘 系统 图 


化 为 OceanStor UDS 


华为 OceanStor UDS (Universal Distributed Storage) 海量 存储 系统 采用 基于 ARM 248 
构 的 低 功 耗 、 高 密度 存储 节点 及 P2P 分 布 式 存储 引擎 等 技术 ， 为 客户 构建 具有 无 限 扩展 
能 力 和 极 低 TCO 的 海量 存储 解决 方案 。 同 时 ，UDS 与 丰富 的 业务 系统 灵活 组 合 ， 可 为 
企业 和 服务 提供 商 提供 海量 资源 池 、 网 盘 、 云 备份 、 活 跃 归 档 等 解决 方案 。UDS 逻辑 视 
图 如 图 13-11 Aras. 


l. 


海量 扩展 

EB 级 扩展 : 支持 小 规模 起 步 ， 从 TB 级 到 EB 级 容量 的 平滑 扩展 ， 存 储 资源 按 
需 供给 。 

细 粒 度 增 长 :基于 SmartDisk 〈 智 能 硬盘 : 1 个 ARM 芯片 管理 1 个 硬盘 )， 性 能 
随 容量 线性 增加 ， 最 小 扩展 单元 为 磁盘 。 

跨 地 域 统 一 资源 池 : 文 持 多 数据 中 心 的 统一 存储 资源 池 ， 跨 地 域 的 数据 见 余 。 


， 安 全 可 靠 


SmartDisk: 最 小 存储 单元 SmartDisk 〈 智 能 硬盘 ) 独 享 CPU 和 网 络 资源 ， 单 点 
损坏 不 影响 其 他 模块 ; 从 最 小 存储 单元 到 数据 中 心 层 面 的 多 级 数据 保护 ,增强 数 
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s 


在 线 存 储 桌面 备份 





图 13-11 UDS 逻辑 视图 


。 HAMAR: 多 节点 并 行 快速 恢复 数据 ， 自 愈 过 程 对 业务 系统 透明 。 
© 数据 安全 : 多 租户 、 加 密 、 数 据 分 片 等 多 纬度 安全 保障 ， 确 保 客 户 数 据 私 密 性 。 
。 高 密 、 低 功 耗 整 机 : 4U 75 盘 位 高 密 整 机 设计 ， 单 机柜 提供 2PB 以 上 容量 ;精细 
化 能 耗 控 制 ， 基 于 ARM 处 理 器 整体 功 耗 降低 50% 以 上 ， 平 均 每 TB 功 耗 低 至 
4.2W。 
。 免 即 时 维护 : 智能 的 系统 监控 和 分 析 ; 自 管 理 ， 面 向 无 人 值守 的 系统 管理 设计 ， 
故障 单元 无 需 即 时 更 换 。 
。 开放 平台 : 支持 标准 化 接口 ， 具 备 多 业务 承载 能 力 ， 保 护 客户 投资 。 
3. UDS 云 存储 系统 在 CERN 中 的 应 用 
UDS 云 存 储 系 统 通过 了 欧洲 核子 研究 中 心 (the European Organization for Nuclear 
Research, CERN) 的 性 能 测试 。 此 次 测试 是 华为 与 CERN 合作 的 重要 组 成 部 分 ， 用 于 存 
储 领 域 创 新 技术 和 架构 的 研究 与 验证 ， 以 应 对 高 能 物理 领域 海量 数据 存储 和 高 性 能 处 理 
需求 的 挑战 。 
CERN 对 存储 方案 的 要 求 大概 可 以 包含 3 个 方面 。 
(1) 可 靠 性 。 特 别 是 在 实验 中 ， 存 储 系统 是 绝对 不 能 宕 机 的 ; 
(2) 性 能 。 每 秒 4 000 万 次 撞击 ，1.5 亿 个 感应 器 ， 对 存储 的 要 求 是 做 到 极 高 的 带宽 
并 保持 很 长 时 间 ; 
(3) TCO 和 扩展 能 力 。 预 计 CERN 在 2013 年 将 会 产生 25PB 实验 数据 ， 这 一 数据 
在 2012 年 是 20PB。 这 样 CERN 每 年 都 需要 采购 大 量 的 存储 设备 加 到 自己 的 数据 中 心 。 
因此 高 性 价 比 和 良好 的 扩展 能 力 是 CERN 对 存储 设备 的 基本 要 求 。 
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华为 的 UDS 完全 可 以 满足 CERN 对 存储 的 需求 。 总 结 来 看 包括 下 面 四 大 优势 。 

1) 可 靠 性 : UDS 分 布 式 架构 的 另外 一 个 好 处 是 ， 提 升 了 单个 节点 故障 下 的 系统 可 
靠 性 。 与 此 同时 ，UDS 将 用 户 数据 切割 成 小 颗粒 的 元 数据 ， 在 存储 这 些 元 数据 时 ，UDS 
支持 多 副本 与 探 除 编码 EC) 两 种 方式 来 存储 数据 ， 提 升 了 单 块 硬盘 故障 下 的 数据 可 靠 
性 。 从 系统 运行 至 今 ，CERN 尚未 丢失 过 实验 数据 。 

2) 卓越 性 能 : 由 于 采用 分 布 式 架构 ， 随 着 存储 节点 数量 的 增加 ，UDS 的 吞吐 能 力 
可 以 持续 提升 。CERN 分 别 对 4KB 一 100MB 不 同 大 小 的 文件 进行 单个 、20 个 、200 个 客 
户 端的 长 时 间 测 试 。 

在 5Gbit/s 的 传输 带宽 下 ，UDS 可 达到 588.4MB/s 的 吞吐 量 。 

在 18Gbit/s 的 传输 带宽 下 ，UDS 可 达到 2 200MB/s MAILE. 

测试 结果 表明 ，UDS 的 吞吐 能 力 几 乎 达到 了 传输 接口 带宽 限制 的 极限 (将 吞吐 
量 乘 以 8， 即 可 换算 为 传输 带宽 )， 其 读 写 性 能 均 高 于 用 于 参考 比 对 的 Open stack 和 
CERN 现 有 的 EOS 系统 。CERN 给 出 的 性 能 测试 结论 为 “Fully achieved expected 
performance”. 

3) TCO 与 扩展 : UDS 采用 分 布 式 架构 ， 用 户 数据 被 分 散 存 储 到 多 个 存储 节点 ， 这 
种 “去 中 心 ” 的 设计 消除 了 扩容 的 瓶 统 ， 使 得 整个 系统 的 扩展 非常 灵活 ， 如 路 地 域 部 署 、 
异地 容 灾 等 ， 可 以 轻松 实现 从 TB 级 到 EB 级 的 存储 容量 。 

UDS 采用 业界 独特 的 ARM 架构 ， 并 在 保证 高 可 靠 的 前 提 下 率先 支持 消费 级 硬盘 。 
ARM 和 消费 级 硬盘 的 超 低 功 耗 ， 首先 帮助 CERN 
大 幅 降 低 了 设备 运行 时 的 功 耗 。 同 时 ，UDS 支持 谁 能 支持 探寻 
特有 的 免 即时 维护 特性 ， 有 利于 CERN 减少 不 必 bb ee 33 
要 的 维护 人 员 。CERN 创建 的 OpenLAB 虽 在 通过 = re A 
部 署 全 球 领先 的 IT 系统 和 解决 方案 ,将 整个 LHC | Be a 
行业 的 资源 、 研 究 成 果 汇 集 一 处 。 而 持续 快速 增 
长 的 海量 科研 数据 对 CERN 的 存储 系统 在 可 扩 
展 性 、 可 靠 性 等 方面 提出 了 严峻 的 挑战 ， 这 也 促 
使 CERN 开始 评估 新 的 存储 技术 。 华 为 UDS 云 
存储 系统 通过 欧洲 核子 研究 中 心 CERN 测试 如 
图 13-12 所 示 。 

“CERN 在 执行 数据 密集 型 模拟 和 分 析 方 面 
正在 面临 极限 ， 同 华为 的 合作 为 我 们 展现 了 一 个 
令 人 激动 的 新 途径 ， 我 们 看 到 华为 云 存 储 优 良 的 
架构 设计 ， 使 得 CERN 在 应 对 未 来 EB 级 数据 量 ae nt ae 
的 挑战 时 能 够 轻松 以 对 。”CERN OpenLAB 的 总 T LT 
ARAMA. SNA. 研究 中 心 CERN ISL 

华为 云 存储 首席 架构 师 詹 姆 斯 、 休 斯 表示 : 

“与 CERN OpenLAB 的 合作 给 了 我 们 一 个 绝 佳 的 机 会 ,来 进一步 发 展 我 们 的 云 存储 产品 ， 
同时 也 证 明了 其 创新 的 架构 设计 在 极端 的 科研 和 海量 数据 环境 的 价值 。” 
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13.4.3 ”华为 Fusionlnsight 大 数据 处 理 平台 


.产品 定位 

ee 部 筑 在 独立 人 硬件 的 各 种 应 用 也 随 之 增多 , 这 给 IT 基础 架构 带 来 很 
多 挑战 ， 如 资源 使 用 效率 低 、 业 务 部 署 费用 高 和 周期 长 。 因 此 IT 部 门 会 逐渐 转 癌 采用 云 
计算 来 增加 数据 共享 、 提 升 资源 利用 率 和 减少 运营 成 本 。 

企业 也 希望 IT 基础 架构 能 够 集成 上 游 和 下 游 产 业 链 , 保护 业务 质量 和 安全 。 为 了 满 
中 这 些 需求 ， 华 为 提供 了 全 面 的 基础 设施 的 虚拟 化 解决 方案 ， 以 满足 企业 期 望 并 使 IT 能 
够 为 企业 创造 更 多 价值 。 

2. 客户 价值 

(1) 简单 

© 充分 融合 的 计算 、 存 储 和 网 络 。 

o 预 验证 的 虚拟 化 基础 设施 。 

。 统一 的 物理 、 虚 拟 资源 管理 ， 做 到 自动 发 现 、 自 动 配置 。 

(2) 敏捷 

。 部 署 时 间 从 月 缩短 到 天 。 

。 灵活 自由 地 计算 、 存 储 配 比 。 

。 线性 扩展 ， 按 需 扩 容 。 

(3) 高 效 | 

。 统一 管理 ， 上 自动化， 一 键 式 部 署 ，OPEX 降低 30%. 

© 软 便 件 深 度 优 化 带 来 性 能 的 飞跃 。 

e 存储 VO 提升 3 一 5 倍 ， 网 络 性 能 提升 3 倍 以 上 。 

(4) 平台 架构 

华为 FusionInsight 大 数据 处 理 平台 , 能够 帮助 企业 快速 构建 海量 数据 信息 处 理 系 统 ， 
通过 对 企业 内 部 和 外 部 的 巨 量 信息 数据 进行 实时 与 非 实时 的 分 析 挖 掘 ， 发 现 全 新 价值 点 
和 企业 商机 。 华 为 FusionInsight 大 数据 平台 架构 如 图 13-13 Aras. 








Eia 银行 数据 全 生命 周期 分 
询 、 经 分 分 析 、 实 时 明细 、 精 准 营 -o 
析 、 精 准 营销 销 、 在 线 征 信 与 风 控 等 












集群 NAS: fy HDS #0 


图 13-13 44% FusionInsight 大 数据 平台 架构 
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(5) 产品 亮点 

易 用 : 让 传统 企业 轻松 驾驭 大 数据 。 

原生 态 的 大 数据 技术 因 其 本 喘 的 复杂 性 ， 局 限 应 用 于 上 自身 具备 强大 研发 实力 的 互联 
网 行业 ， 而 华为 FusionInsight 产品 针对 传统 行业 客户 设计 ， 全 自动 化 在 线 运行 维护 ， 自 
定义 Dashboard， 目 动 化 的 二 次 开发 助手 ， 大 幅 降 低 了 大 数据 在 传统 企业 内 部 的 部 署 难 
度 ， 帮 助 传统 企业 轻松 驾驭 大 数据 业务 。 

安全 : 第 一 家 支持 RBAC 用 户 组 权限 管理 、 消 除 HDFS 明文 存放 。 

可 靠 : 基于 开源 、 优 于 开源 的 产品 性 能 ， 无 单 点 故障 ， 文 持 异 地 容 灾 。 

开源 软件 的 一 个 明显 特性 是 存在 诸多 Bug， 人 性 能 未 经 调 优 ， 功 能 不 够 完善 ， 而 华为 
大 数据 产品 按照 金融 和 电信 行业 对 产品 高 性 能 、 可 靠 性 、 稳 定性 、 安 全 性 的 要 求 设计 ， 
能 够 支撑 企业 级 核心 业务 数据 的 处 理 与 分 析 。 


13.5 “本 章 总 结 


大 数据 的 发 展 是 当下 计算 机 产业 的 热点 。 由 于 大 数据 存在 的 场合 众多 ， 应 用 的 情形 
多 样 化 ， 大 数据 技术 仍旧 处 在 不 断 发 展 当 中 。 大 数据 好 比 是 一 座 矿山 ， 矿 山中 殖 藏 的 财 
富 不 言 而 喻 。 而 仅仅 拥有 这 样 一 座 绰 藏 着 巨大 财富 的 矿山 还 不 够 ， 我 们 更 需要 一 个 强 有 
力 的 工具 对 它 进行 提炼 ， 选 择 出 我 们 需要 的 财富 。 大 数据 就 是 问题 本 身 ， 云 计算 也 就 是 
解决 问题 的 具体 方法 。 当 然 只 有 真正 实现 了 大 数据 高 效 稳定 的 存储 ， 建 立 于 此 基础 上 的 
上 层 建筑 才 有 存在 的 可 能 。 

后 面 的 章节 将 结合 本 章 的 部 分 知识 ， 着 重 介 绍 云 计 算 的 相关 技术 。 


13.6 ”练习 题 
一 、 选 择 题 
1. 以 下 那些 是 大 数据 的 显著 特征 ? C ) 
A. 高 时 效 性 B. 海量 C. 高 价值 D. 低 成 本 
答案 (ABC) 


2. 下 述 对 大 数据 价值 特征 的 表述 正确 的 是 ( )。 
A. 大 数据 就 意味 着 高 价值 密度 和 高 价值 
B. 越 大 的 数据 集 ， 其 价值 越 高 
C. 大 数据 的 价值 完全 依赖 于 它 的 规模 
D. 大 数据 的 价值 密度 和 数据 规模 并 不 一 定 是 线性 增加 关系 


答案 (D) | 
3. 下 列 属 于 CAP 的 三 项 内 容 的 有 ( x 
A. 高 性 能 B. 高 拓展 性 C. 分 区 容忍 性 D. 高 并 发 性 


Zz (D) 
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4. 对 于 大 数据 技术 要 求 的 表述 ， 下 列 说 法 错误 的 是 (  )。 
A. 高 拓展 性 不 仅仅 表现 在 存储 容量 上 的 拓展 
B. CAP 定理 的 限制 使 得 分 布 式 存储 系统 的 性 能 无 法 尽 如 人 意 
C. 提高 大 数据 存储 能 力 就 是 提高 存储 系统 读 写 能 力 
D. 大 数据 存储 的 成 本 需要 进行 必要 的 控制 


ÆR (C) 
5. 视频 文件 属于 ¢ ) 文件 类 型 。 
A. 结构 化 文件 B. 非 结 构 化 文件 C. 半 结 构 化 文件 
答案 (B) 
6. 数据 挖 气 和 大 数据 在 信息 提取 上 的 显著 区 别 是 ( i 
A. 时 效 性 B. 价值 性 C. 复杂 性 D. 多 样 性 
ZR (A) 
7. PB 是 大 数据 时 代 的 一 个 常用 计量 单位 ，1PB= ( A 
A. 1024TB B. 2048GB C. 2440 MB D. 2420 MB 
答案 (A) 


8. 分 布 式 存储 系统 越 来 越 多 地 使 用 在 大 数据 存储 中 ， 以 下 对 分 布 式 存储 系统 表述 
不 正确 的 是 ( Ye 
A. 分 布 式 系统 的 拓展 性 更 好 B. 分 布 式 系统 的 并 发 性 更 易 实 现 
C. 分 布 式 系统 的 设计 架构 简单 D. 分 布 式 系统 的 容错 能 力 更 好 
ZR (C) 
9. 由 于 CAP 定理 的 限制 ， 在 设计 分 布 式 存储 系统 时 ， 不 可 能 满足 其 三 个 方面 的 要 


x, MFE ) 系统 设计 需要 特别 兼顾 一 致 性 。 
A. 大 规模 科学 信息 存储 系统 B. 网 上 书籍 存储 系统 
C. 支付 宝 系统 D. SNS 网 站 
答案 (C) | 
二 、 简 答题 


1. 大 数据 具有 哪些 特征 ? 这 些 特点 会 给 存储 带 来 什么 改变 ? 

2. 为 什么 大 数据 存储 的 拓展 变 得 越 来 越 重 要 ? 广泛 采用 的 横向 拓展 模式 有 什么 
特点 ? 

3. 结合 华为 Oceanstor 9000 设备 的 特点 ， 分 析 它 针对 大 数据 环境 的 突出 优势 。 


14.1 
14.2 

14.3 
14.4 
14.5 
14.6 
14.7 





云 计算 介绍 

云 计算 的 现状 

云 计 算 的 架构 

云 计 算 的 关键 技术 
华为 云 计 算 解 决 方案 
本 章 总 结 

练习 题 





关于 本 章 


在 日 常生 活 中 ,水 、 电 、 煤 气 等 都 是 必 不 可 少 的 ， 这 些 资 源 是 生产 厂家 集中 生产 提供 给 
我 们 使 用 的 ， 这 种 模式 可 以 极 大 地 节约 资源 ， 方 便 我 们 的 生活 。 如 今 ， 计 算 机 几乎 成 为 了 人 
们 生活 当中 必 不 可 少 的 一 部 分 ， 因此， 人 们 希望 能 在 计算 机 上 使 用 这 种 模式 ， 这 样 就 有 了 云 
计算 (cloud computing ) 。 

云 计算 的 最 终 目标 是 将 计算 、 服 务 和 应 用 作为 一 种 公共 设施 提供 给 公众 ， 使 人 们 能 够 像 
使 用 水 、 电 、 煤 气 和 电话 那样 使 用 计算 机 资源 。 

本 章节 将 介绍 云 计 算 的 基础 知识 ， 包 括 云 计算 的 产生 与 发 展 、 云 计算 的 概念 、 云 计算 模 
式 、 云 计算 应 用 和 云 计算 产品 等 相关 内 容 。 通 过 本 章 的 学 习 ， 可 以 初步 了 解 云 计算 的 整体 构 
架 和 云 计算 的 概念 ， 为 深入 学 习 和 研究 云 计算 技术 打 好 基础 。 
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14.1 云 计算 介绍 


14.1.1 云 计算 概念 


云 计 算 (cloud computing) 是 一 种 按 计算 资源 使 用 量 付费 的 模式 ， 这 种 模式 提供 可 
用 、 便 捷 、 按 需 的 网 络 访问 ， 进 入 可 配置 的 计算 资源 共享 池 〈 资 源 包 插 网络 、 服 务 器 、 
存储 、 应 用 软件 、 服 务 )， 只 需 投 入 很 少 的 管理 工作 ， 或 与 服务 供应 商 进行 很 少 的 交互 ， 
就 能 很 快 获得 这 些 资源 如 图 14-1 所 示 。 





14-1 云 计 算 概念 示意 图 


云 计 算是 由 并 行 处 理 、 分 布 式 计算 、 网 格 计算 发 展 来 的 ， 是 一 种 新 兴 的 商业 计算 模 
型 。 目 前 ， 云 计算 正在 不 断 地 发 展 变化 ， 不 同 专家 学 者 对 云 计算 有 着 不 同 的 定义 。 

狭义 的 云 计 算是 指 厂 商 通过 分 布 式 计算 和 虚拟 化 技术 搭建 数据 中 心 或 超级 计算 机 ， 
以 免费 或 按 需 租用 方式 向 技术 开发 者 或 者 企业 客户 提供 数据 存储 、 分 析 以 及 科学 计算 等 
服务 ， 如 亚马逊 数据 仓库 出 租 。 

广义 的 云 计 算是 指 厂 商 通过 建立 网 络 服务 器 集群 ， 向 不 同类 型 客户 提供 在 线 软件 服 
务 、 硬 件 租 借 、 数 据 存储 、 计 算 分 析 等 不 同类 型 的 服务 。 广 义 的 云 计 算 包 括 了 更 多 的 厂 
商 和 服务 类 型 ， 如 谷歌 发 布 的 Google 应 用 程序 套装 等 。 

通俗 的 理解 是 ， 云 计算 的 “ 云 ” 就 是 存在 于 互联 网 上 的 服务 器 集群 资源 ， 它 包括 硬 
件 资 源 〈 服 务 器 、 存 储 器 、CPU 等 ) 和 软件 资源 〈 如 应 用 软件 、 集 成 开发 环境 等 )， 本 
地 客户 端 只 需要 通过 互联 网 发 送 需 求 信 息 ， 远 端 就 会 有 成 千 上 万 的 服务 器 为 你 提供 需要 
的 资源 并 将 结果 返回 到 本 地 客户 端 。 这 样 ， 本 地 客户 端 几乎 不 需要 做 什么 ， 所 有 的 处 理 
都 由 云 计 算 提 供 商 提供 的 服务 器 集群 完成 。 

云 计 算 按 照 服务 类 型 可 以 大 致 分 为 3 类 : 基础 设施 即 服 务 (IaaS)、 平 台 即 服务 
(PaaS)、 软 件 即 服务 (SaaS)。 在 后 面 的 内 容 中 会 详细 介绍 。 
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141.2 云 计 算 的 特点 


云 计 算 具 有 以 下 特点 。 

L ERJ 

云端 可 以 为 用 户 提 供 想 要 的 服务 ， 用 户 可 以 按照 自己 的 需求 来 获取 资源 ， 就 像 现实 
生活 中 使 用 自来水 、 煤 气 、 电 力 等 资源 一 样 。 

2. 虚拟 化 

云 计算 支持 用 户 在 任何 位 置 、 使 用 各 种 终端 获取 服务 。 所 以 请 求 的 资源 来 自 “ 云 ” 
而 不 是 固定 的 有 形 实体 。 当 用 户 使 用 云 服务 时 ， 无 需 知道 资源 运行 的 位 置 ， 只 需要 一 台 
笔记 本 电脑 或 者 手机 ， 就 可 以 接 入 网 络 来 获得 各 种 超 强 力 的 服务 。 

3. 高 可 靠 性 

绝 大 部 分 的 “ 云 ” 商 家 都 采用 了 多 副本 容错 、 计 算 节点 同 构 可 互 换 等 措施 来 保障 服 
务 的 可 靠 性 ， 使 用 户 的 数据 更 加 可 靠 。 

4. 通用 性 

云 计 算 并 不 是 一 种 特定 的 计算 方式 ， 可 以 在 “ 云 ” 端 的 支持 下 衍生 出 千变万化 的 应 
用 ， 而 且 适 用 范围 广 。 

5.， 超 大 规模 的 计算 能 力 

现在 的 各 大 云 计 算 商 家 都 为 用 户 提供 了 非常 多 且 非 常 强大 的 “ 云 ? 服 务 器 , 这 些 “ 云 ” 
服务 器 能 赋予 用 户 前 所 未 有 的 计算 能 力 。 


14.1.3 ” 云 计 算 的 应 用 


云 计 算 应 用 的 范围 很 广 ， 下 面 将 从 云 服务 、 云 计算 、 云 存储 、 云 安全 这 4 个 方面 来 
介绍 云 计 算 的 应 用 。 

1， 云 服务 

云 服 务 是 一 种 更 广义 的 服务 方式 ， 其 中 的 典型 代表 就 是 苹果 的 全 新 云 服 务 iCloud。 
这 是 一 款 可 与 iPhone, iPad, iPodtouch, Mac 或 PC 应 用 程序 完美 兼容 的 突破 性 全 新 云 
服务 免费 套件 , 它 的 iCloudStorage 能 够 通过 无 线 网 络 来 存储 用 户 某 个 苹果 设备 上 的 数据 
内 容 ， 并 自动 通过 无 线 网 络 推送 至 用 户 所 有 的 苹果 设备 。 当 修改 某 个 苹果 设备 上 的 信息 
时 ， 所 有 设备 上 的 信息 几乎 同时 以 无 线 方 式 更 新 。 此 外 ， 还 增加 了 云 备 份 与 音乐 自动 同 
步 功能 ， 云 备份 可 以 每 天 自动 备份 用 户 购买 的 音 乐 、 应 用 、 电 子 书 、 音 频 、 视 频 以 及 设 
置 属性 、 软 件数 据 等 。 

iCloudStorage 可 完好 地 保存 使 用 iCloudStorageAPIs 创建 的 所 有 文档 , 并 自动 推送 至 
用 户 的 全 部 设备 。 用 户 更 改 设备 文档 时 ，iCloud 自动 将 更 改 推送 至 所 有 设备 。iCloud fi) 
新 的 PhotoStream 服务 可 自动 上 传 用 户 拍 摄 的 照片 ， 导 入 任意 设备 ， 并 无 线 推送 至 所 有 
设备 和 计算 机 。 当 用 iPhone 为 好 友 拍 摄 照片 后 ， 可 与 iPad (或 者 AppleTV) 上 的 整个 群 
组 共享 。 这 项 服务 非常 受 欢 迎 ， 如 今 已 有 超过 2 000 万 人 创建 了 iCloud KF. 

2. 云 计 算 

云 计 算 其 实 是 一 种 资源 交付 和 使 用 模式 ， 是 指 通 过 网 络 获得 应 用 所 需 的 资源 。 提 供 
资源 的 网 络 称 为 “ 云 ”。 云 计算 具有 按 需 服务 、 无 限 扩展 、 低 成 本 和 规模 化 等 四 大 特征 。 
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云 计 算 的 核心 思想 是 统一 管理 和 调度 大 量 用 网 络 连接 的 计算 资源 ， 构 成 一 个 计算 资源 池 
向 用 户 提供 按 需 服 务 。 提 供 资 源 的 网 络 被 称 为 “ 云 >“ 云 ”中 的 资源 在 使 用 者 看 来 是 可 
以 无 限 扩展 的 ， 并 且 可 以 随时 获取 ， 按 需 使 用 ， 随 时 扩展 ， 按 使 用 量 付 费 。 

3. BRE 

云 存 储 是 在 云 计 算 概 念 上 延伸 和 发 展 出 来 的 一 个 新 概念 。 在 云 计算 时 代 ， 用 户 你 可 
以 抛弃 U 盘 等 移动 设备 ， 只 需要 进入 GoogleDocs 页 面 ， 新 建文 档 、 编 辑 内 容 ， 然 后 直 
接 将 文档 的 URL 地 址 分 享 给 朋友 或 者 上 司 ， 他 可 以 直接 打开 浏览 器 访问 URL。 再 也 不 
用 担心 因 PC 硬盘 的 损坏 或 者 U 盘 打 不 开 而 发 生 资 料 丢 失事 件 。 

4， 云 安全 

云 安全 (cloud security) 是 网 络 时 代 信 息 安 全 的 新 产物 ， 它 融合 了 并 行 处 理 、 网 格 
计算 、 未 知 病毒 行为 判断 等 新 兴 技 术 和 概念 ， 通 过 网 状 的 大 量 客户 端 监测 网 络 中 软件 行 
为 的 异常 ， 获 取 互 联网 中 木马 、 亚 意 程 序 的 最 新 信息 ， 传 送 到 Server WHET AMAA 
处 理 ， 再 把 解决 方案 分 发 到 每 一 个 客户 端 。 未 来 杀毒 软件 将 无 法 有 效 地 处 理 日 益 增 多 的 
恶意 程序 。 来 自 互 联网 的 主要 威胁 正在 由 计算 机 病毒 转 问 恶意 程序 及 木马 ， 在 这 种 情况 
下 ， 采 用 的 特征 库 判 别 法 显然 已 经 过 时 。 云 安全 技术 应 用 后 ， 识 别 和 查 杀 病毒 不 再 只 依 
靠 本 地 硬盘 中 的 病毒 库 ， 而 是 依靠 庞大 的 网 络 服务 ， 实 时 进行 采集 、 分 析 和 处 理 。 整 个 
互联 网 就 是 一 个 巨大 的 “杀毒 软件 ” 参与 者 越 多 ， 每 个 参与 者 就 越 安全 ， 整 个 互联 网 
就 会 更 安全 。 ws, 瑞星 、 趋势 、 卡 巴 斯 基 、MCAEEE、SYMANTEC、 江 民 科 技 、PANDA、 
金山 、360 安全 卫士 等 都 推出 了 云 安全 解决 方案 。 趋 势 科 技 云 安全 已 经 在 全 球 建立 了 五 
大 数据 中 心 ， 几 万 台 在 线 服务 器 。 


14.2 云 计 算 的 现状 


云 计算 发 展 迅 速 ， 各 大 公司 都 对 其 进行 研发 和 利用 ， 其 中 最 具有 代表 性 的 就 是 
Google、Micnsoft、 亚 马 逊 等 。 每 个 公司 都 有 自己 独特 的 云 计算 服务 ， 云 计算 已 经 成 为 
这 些 公司 未 来 发 展 的 重要 方向。 


14.2.1 Google 云 计算 


Google 公司 具有 目前 世界 上 最 大 的 搜索 引擎 ， 并 在 海量 数据 处 理 方面 拥有 先进 的 技 
术 ， 同 时 ，Google 在 近 几 年 的 发 展 中 ， 充 分 开发 云 计算 ， 提供 了 丰富 的 云端 运用 ， 其 中 
包括 Gmail、Google Docs 等 。 

Google 作为 世界 云 计算 的 “领头 人 ”， 它 在 云 计 算 的 研究 与 开发 方面 非常 出 色 ， 从 
Google 的 整体 技术 构架 来 看 ，Google 计算 系统 依然 是 边 做 科学 研究 ， 边 进行 商业 部 车 ， 
依靠 系统 元 余 和 良好 的 软件 构架 来 低 成 本 支撑 庞大 的 系统 运作 、 大 型 的 并 行 计 算 和 超大 
规模 的 IDC 快速 部 署 ， 通 过 系统 构架 来 使 廉价 PC 服务 器 具有 超过 大 型 机 的 稳定 性 都 已 
经 不 再 是 科学 实验 室 的 故事 ， 而 是 已 经 成 为 互联 网 时 代 、IT 企业 获得 核心 竞争 力 发 展 的 
基石 。 

我 们 日 常 使 用 的 Google Search、Google Earth、Google Map 等 业务 都 是 Google 基于 
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自己 云 计 算 平 台 提 供 的 。Google 也 是 通过 云 计 算 的 方式 ， 大 量 降 低 计算 成 本 ， 使 其 业务 
更 具有 竞争 力 。 

前 面 提 到 了 Google 的 Google App Engine， 这 个 平台 主要 包括 5 个 部 分 : GAE Web 
服务 基础 设施 、 分 布 式 存储 服务 、 应 用 程序 运行 时 环境 、 应 用 开发 套件 和 管理 控制 台 ， 
如 图 14-2 所 示 。 


GAE Web 服务 基础 设施 


分 布 式 应 用 程序 应 用 管理 
存储 服务 运行 时 环境 开发 套件 控制 台 


GAE Web 服务 基础 设施 





14-2 Google App Engine 的 概念 示意 图 


GAEWeb 服务 基础 设施 提供 了 可 伸缩 的 服务 接口 ， 保 证 了 GAE 对 存储 和 网 络 等 资 
源 的 灵活 使 用 管理 。 分 布 式 存 储 服务 提供 了 一 种 基于 对 象 的 结构 化 数据 存储 服务 ， 保 证 
应 用 能 够 安全 、 可 靠 并 且 高 效 地 执行 数据 管理 任务 。 运 行 时 环境 为 应 用 程序 提供 可 自动 
伸缩 的 运行 环境 ， 目 前 应 用 程序 环境 支持 Java 和 Python 两 种 编程 语言 ， 开 发 者 可 以 在 
本 地 使 用 应 用 开发 套件 开发 和 测试 Web 应 用 ， 并 可 以 在 测试 完成 之 后 ， 将 应 用 远程 部 署 
到 GAE 的 生产 环境 。 通 过 GAE 的 管理 控制 台 ， 用 户 可 以 查看 应 用 的 资源 使 用 情况 、 查 
看 或 者 更 新 数据 库 、 管 理应 用 的 版 木 、 查 看 应 用 的 状态 和 日 志 等 。 

从 整体 来 看 ，Google 的 云 计 算 平台 包括 如 下 技术 层次 。 

(1) MBAS: 包括 外 部 网 络 (exterior network)， 这 个 外 部 网 络 并 不 是 指 运营 商 自 
己 的 骨干 网 ， 而 是 指 在 Google 云 计算 服务 器 中 心 以 外 ， 由 Google 上 自己 搭建 的 不 同 地 区 / 
国家 、 不 同 应 用 之 间 的 负载 均衡 的 数据 交换 网 络 。 内 部 网 络 〈Intranet) 连接 Google 自 
建 的 各 个 数据 中 心 之 间 的 网 络 系统 。 

(2) 人 硬件 系统 : 从 层次 上 来 看 ， 包 括 单个 服务 器 、 整 合 了 多 服务 器 的 机 架 以 及 存放 
和 连接 各 个 服务 器 机 架 的 数据 中 心 (Internet data center, IDC). 

(3) 软件 系统 : 包括 服务 器 中 安装 的 单机 操作 系统 、 经 过 修改 的 Redhat Linux 和 
Google 云 计算 底层 软件 系统 (文件 系统 Google file system、 并 行 计算 处 理 算法 map reduce, 
并 行 数据 库 BigTable、 并 行 锁 服 务 chubby lock、 计 算 消息 队列 GWQ)。 

(4) Google 内 部 使 用 的 软件 开发 工具 ， 如 Python. Java, CH. 

(5) Google 目 己 开发 的 应 用 软件 ， 如 Google Search. Google Email, Google Earth. 


14.2.2 ”亚马逊 云 计算 


Amazon 云 计 算 平 台 以 Web 服务 的 方式 将 云 计 算 产 品 提 供给 用 户 ，Amazon Web 
Services (AWS) 是 这 些 Web 服务 的 总 称 。 通 过 AWS 的 基础 设施 层 服务 和 丰富 的 平台 层 
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服务 ， 用 户 可 以 在 Amazon 公司 的 云 计 算 平台 上 构建 各 种 企业 级 应 用 和 个 人 应 用 2 用户 
在 获得 可 靠 、 可 伸缩 、 低 成 本 的 信息 服务 的 同时 ， 可 以 从 复杂 的 数据 中 心 管理 和 维护 工 
作 中 解脱 出 来 . Amazon 公司 的 云 计 算 真正 实现 > l 
了 按 使 用 付费 的 收费 模式 ， AWS 用 户 只 需 为 自 EFT: 


实际 使 用 的 资源 付费 ,从 而 隆 低 了 运营 成 本 ， BS amazon 
亚马逊 云 计算 如 图 14-3 所 示 。 T webservices” 

AWS 基础 设施 层 服 务 包括 计算 服务 、 消 忆 
通信 服务 、 网 络 通信 服务 和 存储 服务 。 一 个 应 用 A Sane 
的 典型 生命 周期 涵盖 了 创建 、 部 署 、 运 行 、 监 挖 和 和 缉 载 等 几 个 阶段 。 在 一 个 应 用 中 经 常 使 用 
各 个 AWS 服务 之 间 的 配合 关系 。 用 户 可 以 将 应 用 部 署 在 EC2 上 ， 通 过 控制 器 启动 、 停 止 和 
监控 应 用 。 计 费 服 务 负责 对 应 用 的 计 费 。 应 用 的 数据 存储 在 Simple DB BK S3 中 。 应 用 系统 
之 间 借 助 SQS 在 不 同 的 控制 器 之 间 进 行 异 步 可 靠 的 消息 通信 ， 从 而 减少 各 个 控制 器 之 间 的 
依赖 ， 使 系统 更 为 稳定 ， 任 何 一 个 控制 器 的 失效 或 者 阻塞 都 不 会 影响 其 他 模块 的 运行 。 

亚马逊 网 络 服务 (Amazon Web Services) 为 亚马逊 的 开发 客户 提供 基于 其 目 有 的 后 
端 技术 平台 、 通 过 互联 网 提供 的 基础 架构 服务 。 利 用 该 技术 平台 ， 开 故人 员 可 以 实现 几 
乎 所 有 类 型 的 业务 。 

亚马逊 提供 的 基础 设施 服务 包括 : 亚马逊 弹性 计算 网 云 、 亚 马 逊 简单 储存 服务 、 亚 
马 逊 简单 数据 库 和 亚马逊 简单 队列 服务 。 

Amazon Web Services 通过 REST 或 者 基于 SOAP 的 网 络 服务 呼叫 , 使 亚马逊 业务 体 
系 的 各 个 模块 都 能 够 连接 和 使 用 。 这 些 模块 可 以 比 作 是 有 2GHz 处 理 器 和 2GB 内 存 的 虚 
拟 计 算 机 系统 ， 并 且 存 储 系统 能 够 容纳 数 TB 级 的 数据 ， 数 据 库 、 支 付 管 理 系 统 、 订 单 
追踪 系统 、 虚 拟 店面 系统 ， 所 有 上 述 情况 的 组 合 ， 甚 至 更 多 。 最 为 关键 的 是 ， 可 以 租用 
大 量 的 虚拟 机 ， 存 储 数 TB 的 数据 ， 或 建立 一 个 互联 网 范围 的 消息 队列 ， 并 且 只 需 向 
Amazon 文 付 消费 的 资源 费用 。 

亚马逊 弹性 计算 云 可 以 理解 成 是 一 个 Web 服务 ， 它 对 外 提供 了 可 调整 的 云 计算 能 
力 。 它 旨 在 使 开发 者 的 网 络 规模 计算 变 得 更 为 容易 。 亚 马 逊 EC2 上 简单 的 Web 服务 界 
面 ， 可 以 让 用 户 轻松 地 获取 和 配置 资源 。 它 提供 给 用 户 对 计算 资源 的 完全 控制 ， 并 运行 
于 亚马逊 已 获 实 证 的 计算 环境 中 。 亚马逊 EC2 将 获取 和 启动 新 的 服务 器 实例 时 间 缩 短 到 
数 分 钟 ， 让 用 户 能 够 迅速 调整 ， 无 论 是 增加 还 是 缩减 ， 适 应 用 户 计 算 需 求 的 变化 。 亚 马 
逊 EC2 让 用 户 只 需 支 付 实际 使 用 的 计算 。 亚 马 逊 EC2 上 提供 开发 工具 来 构建 隔离 故障 
应 用 程序 并 与 日 常 故障 隔离 开 。 

亚马逊 简单 的 存储 服务 可 以 理解 成 是 一 个 以 太 网 上 超大 容量 的 磁盘 。 它 可 以 储存 和 
提取 大 小 从 lbyte 到 5GB 的 非 结 构 化 数据 。S3 称 为 “对 象 ” 或 “目录 ” 它 由 关键 字 、 
数值 和 元 数据 3 部 分 组 成 。 关 键 字 是 该 对 象 的 名 称 ， 数 值 是 该 对 象 的 内 容 ， 元 数据 是 一 
组 描述 对 象 信息 的 关键 字 / 数 值 对 。 对 象 的 名 称 可 以 是 3 一 255 个 字符 ， 亚 马 逊 对 命名 的 
唯一 约束 是 不 要 与 网 址 CIP 地 址 ) 相同 。 

亚马逊 83 专 为 大 型 、 非 结构 化 的 数据 块 设 计 ， 而 SimpleDB 是 为 复杂 的 、 结 构 化 数 
据 建 立 的 。 虽 然 SimpleDB 是 使 用 轻 量 级 并 且 很 容易 掌握 的 查询 语言 实现 的 数据 库 ， 但 
文 持 大 部 分 可 能 会 需要 的 数据 库 操作 ， 包 括 修改 、 查 找 、 插 入 和 删除 。 
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亚马逊 简单 数据 库 不 同 于 Oracle 或 MySQL 那样 的 关系 数据 库 , SimpleDB 数据 库 由 
数据 项 组 成 ， 数 据 项 由 属性 组 成 ， 属 性 是 一 个 名 字 / 数 值 对 。 数 据 项 必须 有 ItemName 属 
性 ， 作 为 数据 项 的 唯一 识别 符 。 每 当 用 户 发 送 一 次 查询 时 ， 系 统 将 返回 ItemName 数值 
的 集合 。 使 用 这 些 数值 作为 输入 执行 Get 操作 , 用 户 可 以 获取 数据 项 的 实际 内 容 (属性)。 

一 个 SimpleDB 数据 库 可 以 成 长 到 10 GB 的 大 小 和 安置 多 达 2.5 亿 个 属性 。 可 以 为 
某 一 特定 数据 项 定义 多 达 256 个 属性 ， 并 没有 规定 一 个 域 中 的 所 有 数据 项 具有 相同 的 属 
性 。 此 外 ， 特 定 的 属性 可 以 有 多 个 值 ， 因 此 ， 客 户 数据 库 可 以 为 单一 customer name 属 
性 存储 多 个 别名 。 

SimpleDB 专 为 支持 “实时 ”( 快 速 周转 ) 查询 设计 。 为 确保 快速 查询 响应 ， 当 数据 
项 被 放置 在 数据 库 中 时 ， 所 有 属性 将 自动 索引 编号 。 亚 马 逊 的 文件 显示 ， 查 询 应 在 5s 
内 完成 ， 否 则 查询 可 能 会 中 止 ， 以 确保 查询 收 到 一 个 快速 反应 。 

亚马逊 简单 队列 服务 相对 于 IMS 或 MQSeries 服务 体系 来 说 ， 只 是 一 个 简单 的 消息 
队列 服务 。 

SQS 消息 只 许 是 文字 ， 并 且 长 度 必须 小 于 8SKB。 可 以 构建 一 个 具有 4 个 功能 的 工作 
队列 : 创建 队列 、 发 送 消息 、 接 收 消息 、 删 除 消息 。 

SQS 队列 主要 设计 支持 分 布 式 计算 机 系统 之 间 的 工作 流 。 


14.2.3 ”微软 云 计 算 


在 云 计算 时 代 ， 微 软 提供 了 全 面 的 云 计 算 解 决 方案 ， 并 借助 其 拥有 的 领先 技术 、 产 
品 和 服务 ， 依 靠 微 软 成 熟 的 软件 平台 、 丰 富 的 互联 网 服务 经 验 及 多 样 化 的 商业 运营 模式 
为 各 种 用 户 提供 全 面 的 云 计算 服 务 ， 真 正 做 到 让 云 触 手 可 及 。 

早 在 互联 网 面世 之 始 ， 微 软 就 建立 了 “借助 互联 网 和 软件 的 力量 ， 为 用 户 创 造 跨越 
不 同 设备 的 无 缝 体 验 ” 的 愿景 ， 而 云 计 算 时 代 的 开局 正 加 速 了 这 个 愿景 的 实现 。 

微软 认为 ， 未 来 的 互联 网 世界 将 会 是 “ 云 + 端 ”的 组 合 ， 在 这 个 以 “ 云 ” 为 中 心 的 
世界 里 ， 用 户 可 以 便捷 地 使 用 各 种 终端 设备 访问 云 中 的 数据 和 应 用 ， a e 
算 机 和 手机 ， 甚 至 是 电视 等 大 家 熟悉 的 各 种 电子 产品 ， 同 时 用 户 在 使 用 各 种 设备 访问 云 
中 的 服务 时 ， 得 到 的 是 完全 相同 的 无 颖 体验 。 其 中 ， 云 计算 平台 是 现 有 IT、 互 联网 技术 
和 业务 模型 逐渐 演变 的 结果 ， 一 个 成 功 的 云 计 算 平台 可 以 最 大 限度 地 发 挥 现 有 软件 开发 
经 验 、 能 力 和 各 种 资源 。 长 期 以 来 ， 微 软 致力 于 云 计算 技术 和 服务 的 不 断 创 新 ， 在 动态 
数据 中 心 、 私 有 云 以 及 公共 云 等 多 方面 开展 了 时 有 成 效 的 探索 和 实践 ， 并 取得 了 业界 领 
先 的 经 验 和 成 绩 。 

微软 的 云 计 算 战 略 包括 三 大 部 分 ， SE Ee PR SOE A 
云 计 算 运 营 模式 。 

l. 微软 运营 

微软 自己 构建 及 运营 公共 云 的 应 用 和 服务 ， 同 时 疝 个 人 消费 者 和 企业 客户 提供 云 服 
务 。 例 如 ， 微 软 向 最 终 使 用 者 提供 的 Online Services 和 Windows Live 等 服务 。 

2. 伙伴 运营 

ISV/SI 等 各 种 合作 伙伴 可 基于 Windows Azure Platform 开发 ERP、CRM 等 各 种 云 计 
算 应 用 ， 并 在 Windows Azure Platform 上 为 最 终 使 用 者 提供 服务 。 另 外 一 个 选择 是 ， 微 
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软 运营 在 自己 的 云 计算 平台 中 的 Business Productivity Online Suite (BPOS) 产品 也 可 交 
由 合作 伙伴 进行 托管 运营 。BPOS 主要 包括 Exchange Online. SharePoint Online. Office 
Communications Online 和 LiveMeeting Online 等 服务 。 

3. 客户 自 建 

客户 可 以 选择 微软 的 云 计算 解决 方案 构建 自己 的 云 计 算 平 台 。 微 软 可 以 为 用 户 提 供 
akm BRK, PAA aE EEE A EMLI 

2008 年 10 月 ， 微 软 发 布 了 自己 的 公共 云 计算 平 台 Windows Azure， 由 此 拉 开 了 
微软 的 云 计 算 大 幕 。Windows Azure 平台 是 运行 在 Microsoft 数据 中 心 ， 为 互联 网 用 户 提 
供 服务 的 一 组 云 计算 技术 的 集合 。 

Windows Azure 平台 由 Windows Azure 及 一 组 平台 服务 构成 ， 如 图 14-4 所 示 。 
Windows Azure 平台 的 基础 设施 层 组 件 是 Windows Azure, 它 作 为 云 平台 的 操作 系统 安装 
在 提供 云 服 务 的 数据 中 心 的 服务 器 上 。WindowsAzure 管理 数据 中 心 的 服务 器 、 存储 和 网 
络 等 资源 .Windows Azure 平 台 给 云 应 用 层 提供 的 平台 层 服 务 包括 :Windows Azure platform 
AppFahric， 为 基于 .NET 的 云 应 用 和 本 地 应 用 的 开发 提供 了 支持 ; SOL Azure, 方便 用 户 以 
服务 的 方式 访问 和 使 用 云 上 的 Microsoft SOL Server 数据 库 。 由 于 采用 了 如 SOAP 和 REST 
等 标准 的 Web 通信 协议 ， 这 些 服务 能 够 很 好 地 和 用 户 的 应 用 及 其 他 云 平台 集成 。 





Windows Azure 


| EY Windows Azure 





图 14-4 ”微软 云 计 算 


14.3 云 计 算 的 架构 


14.3.1 云 计 算 架 构 的 基本 层次 


通过 前 面 内 容 了 解 到 ， 云 计算 按照 服务 模式 可 以 分 为 基础 设施 即 服 务 (IaaS)、 平 台 
即 服务 (PaaS) 和 软件 即 服务 〈S$aaS)， 这 三 种 服务 模式 对 应 云 计 算 架 构 的 3 种 层次 : 基 
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础 设施 层 、 平 台 层 和 应 用 层 。 通 过 这 3 种 基础 层次 向 上 提供 服务 又 可 以 分 为 公有 云 、 私 
有 云 和 混合 云 3 种 类 型 。 云 计算 的 架构 如 图 14-5 所 示 。 


私有 云 RAS 


应 用 层 
软件 及 服务 〈SaaS ) 


平台 层 
FA RMR (PaaS) 





AE Rll Ui Je 
基础 设施 及 服务 Caas) 


图 14-5 云 计算 的 构架 


基础 设施 层 是 经 过 虚拟 化 后 的 硬件 资源 和 相关 功能 的 集合 ， 云 计算 的 虚拟 资源 包括 
计算 、 存 储 和 网 络 等 资源 。 基 础 设施 层 通过 虚拟 化 技术 对 物理 资源 进行 抽象 ， 并 实现 内 
部 流程 自动 化 和 资源 管理 优化 ， 从 而 同 外 部 提供 动态 、 灵 活 的 基础 设施 层 服务 ， 也 是 基 
础 设施 即 服 务 ClaaS) 的 基础 。 

平台 层 提供 平台 即 服务 (PaaS)， 它 介 于 基础 设施 层 和 应 用 层 之 间 ， 通 过 提供 一 个 
平台 让 开发 者 更 加 便利 地 进行 开发 ， 为 云 应 用 提供 了 一 个 安全 可 靠 地 运行 、 管 理 和 控制 
的 环境 。 平 台 层 是 优化 的 “ 云 中 间 件 层 ”， 能 够 更 好 地 满足 云 的 应 用 在 可 伸缩 性 、 可 用 性 
和 安全 性 方面 的 要 求 。 

应 用 层 是 云 上 应 用 软件 的 集合 ， 这 些 应 用 构建 在 基础 设施 层 提 供 的 资源 和 平台 层 提 
供 环境 之 上 ， 通 过 网 络 交 付 给 用 户 。 应 用 层 提供 给 用 户 大 量 的 应 用 ， 使 用 户 可 以 更 加 便 
利 地 使 用 这 些 应 用 ， 用 户 可 以 在 任何 地 点 ， 使 用 任何 终端 登入 云端 来 运用 这 些 应 用 ， 大 
大 方便 了 用 户 。 

这 里 需要 注意 的 是 ， 并 不 是 所 有 的 云 都 必须 同时 提供 以 上 3 种 不 同 层次 的 服务 ， 有 
些 云端 只 提供 其 中 某 一 层次 的 服务 ， 例 如 ，Amazon EC2 和 Google App Engine 就 只 提供 
了 基础 设施 和 平台 层 的 服务 。 

下 面 将 详细 介绍 这 3 种 模式 。 

1. 基础 设施 即 服务 (TaaS ) 

基础 设施 即 服务 是 指 云 供 应 商 将 硬件 等 基础 资源 封装 成 服务 提供 给 用 户 使 用 ， 如 
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Amazon 云 计 算 的 AWS (Amazon Web Services) 的 弹性 云 计算 和 简单 存储 服务 S3. 在 该 
模式 下 ,用 户 相 当 于 在 使 用 一 个 裸 机 和 磁盘 ， 用户 可 以 在 上 面 DIY, 使 用 任何 操作 系统 ， 
做 目 己 想 做 的 试验 、 测 试 数据 等 各 种 事情 。IaaS 能 保证 用 户 在 使 用 的 过 程 中 有 足够 的 计 
算 资 源 ， 并 且 根 据 用 户 使 用 的 量 来 收费 ， 所 以 只 要 用 户 愿意 ， 他 就 能 获得 相对 无 限 的 资 
源 来 进行 操作 ， 同 时 ， 对 于 云端 的 提供 商 , 采用 这 种 模式 能 够 更 好 地 提高 资源 的 利用 率 。 

Amazon EC2 是 基础 设施 及 服务 的 典型 实例 。Amazon EC2 问 虚 拟 机 提供 动态 卫 地 
址 ， 并 且 具 有 相应 的 安全 机 制 来 监控 虚拟 机 节点 间 的 网 络 ， 限 制 不 相关 节点 的 通信 ， 从 
而 保障 了 用 户 的 私密 性 。 从 计 费 方式 来 看 ，EC2 按照 用 户 使 用 资源 的 数量 和 时 间 计 费 ， 
具有 充分 的 灵活 性 。 

2. 平台 即 服务 (PaaS ) 

这 种 模式 下 ， 云 端 是 充分 开发 资源 ， 并 提供 给 用 户 一 个 可 操作 的 平台 、 一 个 应 用 软 
件 的 操作 环境 ， 典 型 的 例子 就 是 Google App Engine。 微 软 的 云 计 算 操 作 系 统 Microsoft 
Windows Azure 也 可 以 归 为 这 一 类 。 相 比较 之 前 的 那 种 模式 ， 用 户 对 资源 的 使 用 会 受到 一 
定 限 制 , 必须 使 用 平台 指定 的 操作 系统 或 者 平台 指定 的 编程 环境 。 例 如 , Google App Engine 
就 只 允许 用 户 使 用 Python 和 Java 语言 。 

在 平台 及 服务 上 进行 开发 相对 于 传统 开发 有 着 很 大 的 优势 。 

(1) 不 需要 开发 者 购买 实体 服务 器 来 进行 开发 ， 通 过 云端 提供 的 服务 器 进行 开发 很 
大 程度 上 节约 了 开 文 ， 开 发 者 也 省 下 了 购买 仪器 等 的 时 间 。 

(2) 具有 强大 的 可 扩展 性 和 强大 的 容量 。 开 发 者 不 会 遇 到 无 法 对 软件 进一步 扩展 以 
及 容量 不 够 的 问题 。 

(3) 平台 及 服务 提供 的 开发 接口 简介 明了 ， 不 需要 开发 者 从 最 基础 的 地 方 开 发 起 。 

(4) 根据 用 户 的 使 用 量 来 收费 ， 这 样 对 于 开发 者 来 说 不 会 产生 浪费 的 资源 。 

3. 软件 即 服务 (SaaS ) 

软件 即 服 务 的 针对 性 更 强 ， 云 端 提 供 商 将 软件 封装 成 服务 提供 给 用 户 使 用 。 在 这 种 
模式 下 ， 软 件 是 在 云端 运行 ， 和 平时 安装 在 计算 机 上 的 软件 有 所 不 同 ， 首 先 ， 在 这 种 模 
式 下 ， 软 件 可 以 在 第 一 时 间 更 新 ， 不 需要 用 户 进行 繁琐 的 下 载 安装 。 其 次 ， 可 以 让 用 户 
在 任何 地 点 使 用 任何 机 器 登入 云端 来 使 用 软件 ， 用 户 使 用 软件 更 加 方便 快捷 。 

软件 及 服务 具有 以 下 3 个 特征 。 

a) 用 户 不 需要 像 使 用 传统 软件 一 样 购买 光盘 进行 软件 安装 ， 软 件 可 以 通过 网 络 下 
载 获得 ， 只 是 在 使 用 软件 时 需要 付费 。 

(2) 每 个 用 户 都 有 上 自己 的 账号 ， 所 以 在 软件 中 登入 自己 的 账号 ， 可 以 看 到 自己 的 配 
置 ， 方 便 用 户 在 任何 地 点 、 任 何 终端 使 用 软件 。 

(3) 软件 不 需要 更 新 ， 每 次 软件 新 版 本 都 会 直接 在 云端 更 新 好 ， 用 户 可 以 随时 享受 
到 最 新 的 软件 功能 。 


14.3.2 ABZ 


AA ze BA SARA EEEa HAEA a m A Pa aA eR 
进行 操作 。 公 有 云 需要 通过 Internet 来 使 用 ， 企 业 把 自己 的 设施 通过 公有 云 的 方式 提供 
给 用 户 使 用 ， 用 户 并 不 拥有 进行 计算 的 设备 ， 只 需要 登入 企业 的 云端 就 可 以 进行 计算 。 
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公有 云 的 意义 在 于 能 够 以 低廉 的 价格 ， 为 用 户 提 供 很 具有 吸引 力 的 服务 ， 从 而 增加 
企业 利益 ， 也 方便 了 用 户 的 使 用 。 


14.3.3 MAG 


私有 云 是 为 一 个 公司 单独 使 用 而 构建 的 ， 因 而 提供 对 数据 、 安 全 性 和 服务 质量 的 最 
有 效 控制 。 该 公司 拥有 基础 设施 ， 并 可 以 控制 在 此 基础 设施 上 部 署 应 用 程序 的 方式 。 私 
有 云 可 部 署 在 企业 数据 中 心 的 防火 墙 内 ， 或 一 个 安全 的 主机 托管 场所 。 


14.3.4 混合 云 


混合 云 是 指 将 两 种 或 两 种 以 上 的 云 (私有 云 、 公 有 云 ) 进行 组 合 利 用 ， 每 个 云 都 保 
持 自 己 的 运作 模式 ， 但 是 整体 合 在 一 起 运作 。 并 不 是 说 私有 云 和 公有 云 各 自 为 政 ， 而 是 
私有 云 和 公有 云 协 调 工 作 。 下 面 是 一 个 经 典 实 例 。 在 私有 云 中 实现 利用 存储 、 数 据 库 和 
服务 处 理 ， 同 时 ， 在 无 需 购买 额外 硬件 的 情况 下 ， 在 需求 高 峰 期 充分 利用 公有 云 来 完成 
数据 处 理 需 求 。 目 前 ， 已 经 有 很 多 企业 都 朝 着 这 种 集中 云 (cloud-bursting) 的 架构 发 展 ， 
这 也 是 实现 利益 最 大 化 的 关键 。 

因为 公有 云 上 只 会 针对 用 户 使 用 的 资源 收费 ， 所 以 集中 云 将 变 成 处 理 需 求 高 峰 的 一 个 
非常 便宜 的 方式 。 比 如 对 一 些 零 售 商 来 说 , 他 们 的 操作 需求 会 随 着 节假日 的 到 来 而 剧 增 ， 
或 者 是 有 些 业 务 会 季节 性 的 上 扬 。 

混合 云 也 为 其 他 目的 的 弹性 需求 提供 了 很 好 的 基础 ， 如 灾难 恢复 。 这 意味 着 私有 云 
把 公有 云 作为 灾难 转移 的 平台 , 并 在 需要 的 时 候 使 用 它 。 这 是 一 个 极 具 成 本 效应 的 理念 。 
男 一 个 好 的 理念 是 使 用 公有 云 作为 一 个 选择 性 的 平台 ， 选 择 其 他 的 公有 云 作 为 灾难 转移 
平台 。 


14.4 云 计 算 的 关键 技术 


14.4.1 虚拟 化 技术 


1. 虚拟 化 的 定义 

虚拟 相对 于 真实 ， 虚 拟 化 就 是 将 原本 运行 在 真实 环境 上 的 计算 机 系统 或 者 组 件 运行 
在 虚拟 出 来 的 环境 中 。 一 般 来 说 ， 计 算 机 系统 分 为 若干 层次 ， 从 上 至 下 包括 底层 硬件 资 
源 、 操 作 系统 、 操 作 系 统 提供 的 应 用 程序 接口 。 虚 拟 化 技术 可 以 在 这 些 不 同 层次 中 构建 
虚拟 化 层 ， 巾 上 提供 与 真实 层次 相同 或 类 似 的 功能 。 

虚拟 化 是 一 个 广泛 而 变化 的 概念 ， 在 维基 百科 中 的 定义 如 下 。 

“虚拟 化 (Virtualization〉 是 将 计算 机 物理 资源 如 服务 器 、 网 络 、 内 存 及 存储 等 予以 
抽象 、 转 换 后 呈现 出 来 ， 使 用 户 可 以 比 原 本 的 组 态 更 好 的 方式 来 应 用 这 些 资源 。 这 些 资 
源 的 新 虚拟 部 分 不 受 现 有 资源 的 架设 方式 、 地 域 或 物理 组 态 的 限制 。 一 般 所 指 的 虚拟 化 
资源 包括 计算 能 力 和 资料 储存 。” 

虚拟 化 虽然 是 一 个 抽象 的 概念 ， 但 是 其 有 以 下 三 层 直观 的 含义 。 
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(1) 虚拟 化 的 对 象 是 各 种 各 样 的 资源 。 

(2) 经 过 虚拟 化 后 的 逻辑 资源 对 用 户 隐 藏 了 不 必要 的 细节 。 

(3) 用 户 可 以 在 虚拟 环境 中 实现 其 在 真实 环境 中 的 部 分 或 者 全 部 功能 。 

2. 常见 的 虚拟 化 类 型 

在 虚拟 化 技术 中 , 被 虚拟 化 的 实体 是 各 种 各 样 的 IT 资源 ， 按 照 这 些 资源 的 类 型 ， 可 
以 梳理 出 不 同类 型 的 虚拟 化 。 以 下 是 虚拟 化 常见 的 几 种 类 型 。 

(1) 基础 设施 虚拟 化 

网 络 虚 拟 化 : 将 网 络 的 硬件 和 软件 资源 整合 ， 向 用 户 提 供 虚 拟 网 络 连 接 。 

存储 虚拟 化 : 为 物理 的 存储 设备 提供 一 个 抽象 的 逻辑 视图 ， 用 户 可 以 通过 这 个 视图 
中 的 统一 逻辑 接口 来 访问 被 整合 的 存储 资源 。 

基于 存储 设备 的 存储 虚拟 化 一 一 磁盘 阵列 技术 (RAID)。 

基于 网 络 的 存储 虚拟 化 一 一 网 络 附加 存储 (NAS)、 存 储 区 域 网 (SAN )。 

(2) 系统 虚拟 化 

实现 操作 系统 与 物理 计算 机 的 分 离 ， 使 得 在 一 台 物 理 计 算 机 上 可 以 同时 安装 和 运行 
一 个 或 多 个 虚拟 的 操作 系统 。 

虚拟 机 : 是 使 用 系统 虚拟 化 技术 ， 运 行 在 一 个 隔离 环境 中 ， 具 有 完整 硬件 功能 的 逻 
辑 计 算 机 系统 ， 包 括 操作 系统 和 其 中 的 应 用 程序 。 

(3) 软件 虚拟 化 

应 用 虚拟 化 : 将 应 用 程序 与 操作 系统 解 耦 合 ， 为 应 用 程序 提供 一 个 虚拟 的 运行 
rapt 

级 语言 虚拟 化 : 解决 可 执行 程序 在 不 同体 系 结构 计算 机 之 间 的 迁移 问题 。 

i ENEDA 

目前 普遍 使 用 的 3 种 虚拟 化 技术 是 VMware Infrastructure, Ken 和 KVM. 

VMware 作为 虚拟 化 技术 中 的 龙头 ， 开 发 设计 的 VMware Infrastructure 能 创建 自我 
优化 的 IT 基础 架构 ，VMware Infrastructure 作为 一 个 虚拟 数据 中 心 的 操作 系统 ， 可 以 确 
保 应 用 程序 的 可 用 性 、 安 全 性 和 可 扩展 性 。 其 优点 如 下 。 

C1) 通过 整合 服务 器 降低 IT 成 本 并 提高 灵活 性 。 

(2) 减少 计划 内 和 计划 外 停机 ， 以 改进 业务 连续 性 。 

(3) 运行 较 少 的 服务 器 并 动态 关闭 不 使 用 的 服务 器 。 

Xen 是 由 XenSource 管理 的 一 个 开源 GPL 项 目 。Xen 是 openSUSE 和 Novell 主要 支 
持 的 虚拟 化 技术 ， 它 能 够 创建 更 多 的 虚拟 机 ， 每 一 个 虚拟 机 都 是 运行 在 同一 个 操作 系统 
上 的 实例 。 

服务 器 上 的 虚拟 机 通过 两 种 模式 运行 : 全 虚拟 化 和 半 虚 拟 化 。 全 虚拟 化 是 一 种 完全 
模拟 所 有 硬件 设备 的 虚拟 化 模式 ; SHOW esha HAL Mirek dik A 
模式 。 

KVM 是 指 基于 Linux AK (Kernel-based) 的 虚拟 机 (Virtual Machine)， 是 以 色 列 
的 一 个 开源 组 织 提 出 的 一 种 新 的 虚拟 机 实现 方案 ， 也 称 为 内 核 虚拟 机 。 

虚拟 化 技术 通过 将 工作 量 灵活 分 配给 不 同 的 物理 机 实现 资源 共享 。 但 这 样 一 来 ， 部 
分 内 存 就 会 处 于 空 闪 状态 。 为 了 提高 系统 性 能 和 内 存 的 有 效 利用 率 ， 可 以 通过 交换 设备 
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的 虚拟 化 ， 以 及 内 存 灵 活动 态 的 交换 管理 来 实现 。 
14.4.2 ”数据 存储 技术 


云 存 储 是 在 云 计算 概念 上 延伸 和 发 展 出 来 的 新 概念 ， 是 指 通过 集群 应 用 、 网 格 技术 
或 分 布 式 文件 系统 等 功能 ， 将 网 络 中 大 量 各 种 不 同类 型 的 存储 设备 通过 应 用 软件 集合 起 
来 协同 工作 ， 共 同 对 外 提供 数据 存储 和 业务 访问 功能 的 一 个 系统 。 

当 云 计算 系统 运算 和 处 理 的 核心 是 大 量 数据 的 存储 和 管理 时 ， 云 计算 系统 需要 配置 
大 量 存储 设备 ， 云 计算 系统 就 转变 成 一 个 云 存 储 系 统 ， 因 此 云 存储 是 一 个 以 数据 存储 和 
管理 为 核心 的 云 计算 系统 。 | 

云 计 算是 分 布 式 处 理 、 并 行 处 理 和 网 格 计 算 发 展 的 产物 ， 是 通过 网 络 将 庞大 的 计算 
处 理 程 序 自动 分 拆 成 无 数 个 较 小 的 子 程序 ， 再 交 由 多 部 服务 器 组 成 的 庞大 系统 经 计算 分 
析 之 后 将 处 理 结果 回 传 给 用 户 。 通 过 云 计算 技术 ， 网 络 服 务 提供 者 可 以 在 数秒 之 内 ， 处 
理 数 以 千 万 计 的 信息 。 

云 存 储 的 概念 与 云 计 算 类 似 ， 它 是 指 通过 集群 应 用 、 网 格 技术 或 分 布 式 文件 系 
统 等 功能 , 将 网 络 中 大 量 各 种 不 同类 型 的 存储 设备 通过 应 用 软件 集合 起 来 协同 工作 ， 
共同 对 外 提供 数据 存储 和 业务 访问 功能 的 一 个 系统 ， 保 证 数据 的 安全 性 ， 并 节约 存 
储 空间 。 如 果 这 样 解 释 还 是 难以 理解 ， 那 么 可 以 借用 广域网 和 互联 网 的 结构 来 解释 
云 存储 。 

云 存 储 系统 的 结构 模型 由 四 层 组 成 如 图 14-6 所 示 。 


数据 备份 
访问 层 个 人 空间 服 数据 归档 在 线 编辑 文档 视频 监控 
务 、 运 营 商 空 集中 存储 网 络 游戏 Ry 
间 租赁 等 eron f 网 络 视频 


网 络 《〈 广 域 网 或 互联 网 ) 接 入 、 用 户 认证 、 权 限 管理 











an ts 公用 API 接口 、 应 用 软件 、web service 等 
视频 监控 软件 
IPTV 点 播 软件 
集群 系统 ai 数据 加 密 
solani loaned 分 布 式 文件 系统 eee 数据 备份 
网 格 计算 serie 数据 容 灾 
存储 层 存储 虚拟 化 、 存 储 集中 管理 、 状 态 监控 、 维 护 升级 等 
存储 设备 (NAS, FC. iSCSI 等 ) 
14-6 云 存 储 概念 的 示意 图 
l. 存储 层 


存储 层 是 云 存 储 最 基础 的 部 分 。 存 储 设 备 可 以 是 光纤 通道 存储 设备 ， 可 以 是 NAS 
和 iSCSI 等 IP 存储 设备 ， 也 可 以 是 SCSI 或 SAS | DAS 存储 设备 。 云 存储 中 的 存储 设 
备 往往 数量 庞大 且 分 布 在 不 同 地域 ， 彼 此 之 间 通 过 广域网 、 互 联网 或 者 FC 光纤 通道 网 
络 连接 在 一 起 。 
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存储 设备 之 上 是 一 个 统一 存储 设备 管理 系统 ， 可 以 实现 存储 设备 的 逻辑 虚拟 化 管 
理 、 多 链 路 元 余 管 理 ， 以 及 硬件 设备 的 状态 监控 和 故障 维护 。 

2. 基础 管理 

基础 管理 层 是 云 存储 最 核心 的 部 分 ， 也 是 云 存储 中 最 难以 实现 的 部 分 。 基 础 管理 层 
通过 集群 、 分 布 式 文件 系统 和 网 格 计算 等 技术 ， 实 现 云 存储 中 多 个 存储 设备 之 间 的 协同 
工作 ， 使 多 个 存储 设备 可 以 对 外 提供 同一 种 服务 ， 并 提供 更 大 、 更 强 、 更 好 的 数据 访问 
性 能 。 

3， 应 用 接口 

应 用 接口 层 是 云 存储 最 灵活 多 变 的 部 分 。 不 同 的 云 存储 运营 单位 可 以 根据 实际 业务 
类 型 ， 开 发 不 同 的 应 用 服务 接口 ， 提 供 不 同 的 应 用 服务 。 比 如 视频 监控 应 用 平台 、IPTV 
和 视频 扣 播 应 用 平台 、 网 络 硬盘 引用 平台 、 远 程 数据 备份 应 用 平台 等 。 

4. 访问 层 

任何 一 个 授权 用 户 都 可 以 通过 标准 的 公用 应 用 接口 来 登录 云 存储 系统 ， 享 受 云 存 储 
服务 。 云 存储 运营 单位 不 同 ， 云 存储 提供 的 访问 类 型 和 访问 手段 也 不 同 。 


14.5 ”华为 云 计 算 解 决 方案 


14.5.1 云 操 作 系 统 FusionSphere 


FusionSphere 是 华为 目 主 知识 产权 的 云 操作 系统 ， 包 括 FusionCompute 虚拟 化 引擎 
和 FusionManager 云 管 理 等 组 件 。 

数据 中 心虚 拟 化 提升 IT 效率 和 创造 客户 价值 ,数据 中 心虚 拟 化 在 服务 器 虚拟 化 的 基 
础 上 ,通过 软件 整合 和 资源 抽象 ， 构 建 计 算 和 存储 虚拟 化 资源 池 ， 集 中 管理 和 统一 调度 ， 
实现 资源 弹性 伸缩 和 灵活 的 热 迁移 。 数 据 中 心虚 拟 化 还 要 保障 数据 中 心 从 虚拟 化 层 到 业 
务 层 的 数据 保护 和 业务 容 灾 ， 实 现 跨 数据 中 心 的 应 用 调度 ， 使 企业 和 运营 商 的 业务 持续 
发 展 。 

1. FusionCompute 虚拟 化 

FusionCompute 是 云 操作 系统 基础 软件 ， 主 要 由 虚拟 化 基础 平台 和 云 基 础 服务 平台 
组 成 ， 主 要 负责 硬件 资源 的 虚拟 化 ， 以 及 对 虚拟 资源 、 业 务 资源 、 用 户 资 源 的 集中 管理 。 
它 采 用 虚拟 计算 、 虚 拟 存储 、 虚 拟 网 络 等 技术 ， 完 成 计算 资源 、 存 储 资源 、 网 络 资源 的 
虚拟 化 ; 同时 通过 统一 的 接口 ， 对 这 些 虚 拟 资源 进行 集中 调度 和 管理 ， 降 低 业 务 的 运行 
成 本 ， 保 证 系统 的 安全 性 和 可 靠 性 ， 协 助 运营 商 和 企业 客户 构建 安全 、 绿 色 、 节 能 的 云 
数据 中 心 。FusionCompute 的 架构 示意 图 如 图 14-7 所 示 。 

2. FusionManager 云 管 理 

华为 FusionManager 是 云 管理 系统 ,通过 统一 的 接口 ， 对 计算 、 网 络 和 存储 等 虚拟 
资源 进行 集中 调度 和 管理 ， 提 升 运 维 效率 ， 保 证 系统 的 安全 性 和 可 靠 性 ， 帮 助 运营 商 
和 企业 构筑 安全 、 绿 色 、 节 能 的 云 数据 中 心 。FusionManager 的 架构 示意 图 如 图 14-8 
所 示 。 


6148 云 计算 基础 307 


FusionCompute 


云 基础 服务 平台 





图 14-7 Fusion Compute 的 架构 示意 图 






FusionManager 


云 服务 自动 化 资源 统计 和 监控 ! 
服务 器 / 网 络 / 存储 自动 化 资源 集群 管理 
基础 设施 资源 管理 







华为 虚拟 化 软件 第 三 方 虚拟 化 软件 物理 基础 设施 


14-8 Fusion Manager 的 架构 示意 图 


14.5.2 ”融合 一 体 机 FusionCube 


随 着 云 计算 时 代 的 来 临 ， 商 业 环 境 中 超过 半数 的 x86 服务 器 已 经 应 用 了 虚拟 化 技术 。 
虚拟 化 技术 降低 了 成 本 , 提升 了 资源 利用 率 并 带 来 了 更 敏捷 的 业务 效率 , 但 是 也 对 系统 管理 
员 的 技术 水 平 提出 了 更 高 的 要 求 。 部 署 简单 、 运 维 便捷 的 融合 一 体 机 成 为 IT 发 展 的 新 趋势 。 

FusionCube 是 计算 、 存 储 、 网 络 深度 融合 的 基础 设施 一 体 机 ， 为 企业 信息 化 提供 了 一 
体 化 的 云 平 台 , 能 够 对 IT 系统 进行 整合 与 简化 , 帮助 企业 聚焦 主 营业 务 , 精简 IT 基础 设施 。 
FusionCube 具有 融 《〈 深 度 融 合 )、 简 〈 家 电 式 安装 )、 优 〈 业 务 加 速 3 一 10 倍 ) WYRE RA 

华为 FusionCube 遵循 开放 架构 标准 ， 于 12U 机 框 
中 融合 刀片 服务 器 、 分 布 式 存储 及 网 络 交 换 机 为 一 体 ， 
并 预 集成 了 虚拟 化 平台 及 云 管理 软件 ;实现 了 一 站 式 交 
付 、 家 电化 安装 ， 资 源 可 按 需 调配 、 线 性 扩展 ; 并 针对 
不 同 应 用 场景 进行 了 深入 的 性 能 优化 。 在 企业 虚拟 化 平 
台 、 数 据 人 仓库、 桌面 云 、 数 据 中 心 建设 等 场景 中 ， 
FusionCube Æ IT 基础 设施 的 当然 之 选 。Fusion Cube 融 
合 一 体 机 如 图 14-9 所 示 。 图 14-9 Fusion Cube 融合 一 体 机 
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14.5.3 ”桌面 云 FusionAccess 


FusionCloud 桌面 云 解决 方案 将 虚拟 化 技术 、 远 程 昌 面 连接 技术 、 瘦 客户 端 技术 、 移 
动 软 终端 技术 相 结 合 ,实现 企业 固定 和 移动 办 公 的 融合 。 它 将 办 公 数 据 集中 存放 在 云端 ， 
通过 任意 终端 随时 访问 ， 完 美 地 解决 了 数据 安全 、 运 维 效率 、 灵 活 接 入 和 移动 体验 的 问 
题 ， 成 为 越 来 越 多 企业 PC 昌 面 的 首选 替代 方案 。 云 昌 面 架构 示意 图 如 图 14-10 所 示 。 
三 大 场景 应 用 | 行业 应 用 

A 


W pe 2 \ 
安全 办 公 呼 虽 中 心 分 支 机 构 








E r | 


sss 桌面 和 应 用 


SS 云 操作 系统 

| eon 虚拟 资源 池 
Tea f 
Phone Pad PC Notebook PC TC 





K| 14-10 云 桌 面 架 构 示 意图 


企业 在 日 益 竞争 激烈 的 今天 ， 如 何 保护 企业 资产 安全 ， 如 何 高 效 简单 地 管理 IT， 如 
何 让 创新 快速 实践 推广 ， 如 何 有 效 控制 成 本 等 ， 成 为 CIO、CTO 必须 考虑 的 问题 。 传 统 
桌面 PC 作为 企业 IT 中 最 普遍 ， 也 是 最 重要 的 办 公设 备 ， 
在 企业 运转 中 , 越 来 越 暴 露出 其 弊端 和 不 便 。 企 业 必 须 寻 找 
一 种 灵活 的 基础 架构 来 解决 IT 供需 矛盾 和 企业 信息 安全 问 
题 。 桌 面 云 正 是 这 样 一 个 最 佳 的 云 计算 实践 ， 采 用 最 新 的 云 
计算 的 技术 和 理念 ， 引 领 IT 基础 架构 的 变革 和 创新 。 

华为 桌面 云 解 决 方案 由 桌面 云 软件 FusionAccess、 虚拟 
化 软件 FusionSphere、 数 据 中 心 基础 设施 , 如 服务 器 、 人 存储 、 
网 络 和 安全 产品 以 及 系列 化 终 问 构成 如 图 14-11 所 示 。 华为 
桌面 云 是 大 规模 商用 的 成 熟 解决 方案 , 广泛 部 署 于 全 球 40 
多 个 国家 拥有 200 多 个 客户 。 图 14-11 46% CT5000 云 终端 





14.6 RBA 


云 计算 是 当前 最 热门 的 IT 技术 之 一 , 无 论 什 么 产品 都 在 向 云 计算 的 方向 靠拢。 云 计 
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算 开创 了 一 个 新 的 服务 时 代 ， 使 人 们 的 生活 更 加 方便 快捷 。 通 过 本 章 的 学 习 ， 应 该 掌握 
WR ILE 

e 云 计 算 的 定义 。 

。 去 计算 的 发 展现 状 ， 各 大 公司 对 云 计 算 的 利用 以 及 他 们 提出 的 云 计 算 方案 。 

© 云 计 算 的 整体 架构 以 及 3 种 服务 模式 。 

对 云 计算 有 一 定 的 了 解 后 ， 就 可 以 根据 一 些 现 有 的 云 计 算 网 站 或 者 云 计算 平台 做 进 
一 步 的 了 解 ， 云 计算 还 有 非常 大 的 发 展 空间 ， 等 待 你 去 探索 。 


14.7 练习 题 


一 、 选 择 题 
. 云 计算 按照 服务 类 型 可 以 大 致 分 为 3 类 ， 下 面 ( ) 类 不 包括 在 内 。 
A. 基础 设施 即 服务 B. 平台 即 服 务 
C. 软件 即 服 务 D. 存储 即 服 务 
答案 (D) 
2. 云 计 算 架 构 分 成 3 个 基本 层次 ， 下 面 ¢ ) 层次 不 包括 在 内 。 
A. 基础 设施 层 B. 存储 层 C. 平台 层 D. 应 用 层 。 
答案 (B) 
3. 下 列 不 属于 云 计算 应 用 的 是 〈 由 | 
A. 云 存储 B: Bee C. BARS D. 云 识 别 
答案 (D) 
4. 下 列 不 属于 云 计 算 特 点 的 是 Ja 
A. 虚拟 化 B. 平台 相关 性 强 C. 高 可 靠 性 D. 按 需 服务 
答案 (B) 
、 简 答题 


1. 云 计算 的 定义 是 什么 ?什么 才 可 以 称 为 云 计算 ? 

2. 云 计算 虚拟 化 技术 主要 采用 哪些 技术 ? 它们 的 优点 是 什么 ? 

3. 云 计 算 的 3 种 服务 模式 分 别 是 什么 ? 简 述 这 3 种 模式 的 概念 。 
4. 分 别 举 一 个 例子 来 进一步 说 明 上 面 3 种 服务 模式 是 如 何 运 作 的 。 


15.1 
15.2 
15.3 
15.4 
15.5 
15.6 
15.7 





数据 中 心 的 产生 与 发 展 
数据 中 心 的 现状 
数据 中 心 的 构建 
数据 中 心 的 关键 技术 
华为 数据 中 心 解 决 方案 
本 章 总 结 

练习 题 





关于 本 章 


本 章 主要 介绍 数据 中 心 的 发 展 历史 及 其 产生 意义 ， 以 及 随 着 云 计 算 浪 潮 和 大 数据 时 代 的 
来 临 ， 传 统 的 数据 中 心 向 云 数 据 中 心 演进 的 过 程 。 最 后 介绍 了 华为 推出 的 众多 数据 中 心 解 决 
方案 。 
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15.1 数据 中 心 的 产生 与 发 展 


数据 中 心 (data center) 通常 是 指 在 一 个 物理 空间 内 实现 信息 的 集中 存储 、 处 理 、 传 
输 和 管理 。 

其 中 ， 服 务 器 设备 通常 被 认为 是 数据 中 心 的 关键 设备 。 而 关键 设备 运行 所 需 的 环境 
因素 ， 如 供电 系统 、 人 制冷 系统 、 机 柜 系 统 、 消 防 系统 、 监 控 系 统 等 通常 被 认为 是 关键 物 
理 基 础 设施 。 


15.1.1 ”数据 中 心 的 产生 背景 


数据 中 心 的 出 现 是 有 其 历史 意义 的 。 早 期 的 计算 机 都 是 非常 庞大 的 电子 系统 ， 其 操 
作 和 维护 都 十 分 复杂 ， 需 要 一 个 特殊 的 环境 来 实施 。 而 连接 所 有 的 组 件 需 要 很 多 电缆 ， 
同时 那些 原始 的 大 型 主机 耗 电 量 巨 大 ， 不 得 不 采取 一 些 冷 却 的 措施 来 防止 它们 过 热 ， 因 
此 人 们 开始 考虑 采用 一 些 方案 来 设计 放置 计算 机 的 机 房 。 

随 着 微型 计算 机 的 普及 ， 尤 其 是 上 世纪 80 年 代 ， 计 算 机 被 用 于 社会 的 各 行 各 业 ， 
很 多 公司 开始 考虑 到 控制 IT 资源 的 必要 性 。 到 了 90 FR, Linux 和 免费 的 UNIX 操作 
系统 出 现 了 ， 这 些 分 时 操作 系统 严重 依赖 于 客户 端 一 一 服务 器 模式 ， 这 使 得 对 通过 服务 
器 的 互联 而 达到 资源 在 多 用 户 之 间 共 享 的 需求 变 得 迫切 ， 人 们 开始 重新 审视 和 定位 机 房 
中 的 服务 器 。 随 着 网 络 设 备 的 逐渐 普及 以 及 网 络 电 缆 架 设 新 标准 的 提出 ， 用 分 层 设计 来 
将 服务 器 放置 到 公司 的 IT 机 房 成 为 可 能 ， 就 在 这 时 ,“ 数 据 中 心 ”的 概念 被 正式 提出 ， 
并 获得 人 们 的 认可 ， 开 始 在 社会 广泛 流传 起 来 。 

数据 中 心 发 展 的 繁荣 期 则 是 在 网 络 泡 沫 到 来 时 。 此 后 数据 中 心 发 展 出 了 3 种 
类 型 : 

1. Internet 数据 中 心 

早期 时 候 ， 公 司 都 希望 能 有 高 速 的 Internet 连接 以 及 能 不 间断 地 在 网 络 上 部 署 系统 ， 
因此 需要 安装 一 些 昂贵 的 设备 ,但 那 时 候 安 装 这 些 设备 对 于 小 公司 来 说 几乎 是 不 可 能 的 。 
于 是 ， 许 多 公司 瞄准 了 这 个 问题 ， 它 们 建立 起 被 称 为 Internet 数据 中 心 (Internet data 
centers) 的 设施 来 提供 商业 上 的 系统 部 署 解决 方案 并 获得 了 成 功 。 

2. 个 人 数据 中 心 

随后 ， 一 些 人 尝试 将 Internet 数据 中 心里 的 技术 移植 应 用 到 为 个 人 服务 上 ， 于 是 产 
生 了 个 人 数据 中 心 (private data centers)， 并 且 因 其 高 效 性 而 得 到 广泛 应 用 。 

3. 云 数据 中 心 

后 来 ， 随 着 云 计 算 概念 的 提出 ， 被 用 于 云 计算 的 数据 中 心 出 现 了 ， 它 们 被 称 为 云 数 
据 中 心 (cloud data centers). 

现在 像 Internet 数据 中 心 、 个 人 数据 中 心 等 这 些 具体 的 称谓 几乎 已 经 没有 人 使 用 了 ， 
人 们 一 般 都 习惯 统称 它们 为 “数据 中 心 ”。 

而 随 着 科技 的 不 断 发 展 ， 各 种 新 式 的 数据 中 心 也 频频 浮现 。 例 如 ， 提 到 传统 的 数 
据 中 心 ， 人 们 往往 都 会 联想 起 宽敞 的 机 房 和 排列 整齐 的 机 架 ， 但 是 近年 来 出 现 了 一 种 
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将 服务 器 、 存 储 、 网 络 设备 等 一 股 脑 地 放 入 集装箱 的 数据 中 心 ， 它 就 是 集装箱 式 数 据 
中 心 。 
图 15-1 所 示 为 华为 推出 的 集装箱 式 数据 中 心 。 





图 15-1 华为 集装箱 式 数 据 中 心 


15.1.2 ”数据 中 心 的 发 展 历 程 


数据 中 心 的 发 展 一 共 经 历 了 以 下 4 个 阶段 。 

1. 第 一 阶段 

1945—1971 年 ， 计 算 机 器 件 组 成 主要 以 电子 管 、 晶 体 管 为 主 ， 体 积 大 、 耗 电大 ， 主 
要 运用 于 国防 机 构 、 科 学 研究 等 军事 或 者 准 军 事 机 构 。 计 算 消耗 的 资源 过 大 ， 成 本 过 高 ， 
因此 集中 计算 的 各 种 资源 成 为 必然 的 选择 。 同 时 , 也 诞生 了 与 之 配套 的 第 一 代数 据 机 房 。 
不 间断 电源 Cuninterruptible power supply，UPS)、 精 密 机 房 专业 空调 就 是 在 这 个 时 代 诞 
生 的 。 

2. 第 二 阶段 

1971—1995 年 , 随 着 大 规模 集成 电路 的 迅速 发 展 , 计算 机 除了 向 巨型 机 方向 发 展 外 ， 
更 多 地 朝 着 小 型 机 和 微型 机 方向 快速 演进 。1971 年 年 未 ， 世 界 上 第 一 台 微 型 计算 机 在 美 
国 旧 金山 南部 的 硅谷 应 运 而 生 ， 它 开创 了 微型 计算 机 的 新 时 代 。 在 这 个 时 代 ， 计 算 的 形 
态 总 地 来 说 以 分 散 为 主 ， 分 散 与 集中 并 存 。 因 此 ， 数 据 机 房 也 就 处 于 各 种 小 型 、 中 型 、 
大 型 机 房 并 存 的 态势 ， 特 别 是 中 小 型 机 房 得 到 了 爆炸 式 的 发 展 。 

3. 第 三 阶段 

1995 一 2005 年 ， 互 联网 的 兴起 被 视 为 计算 行业 在 发 明 计 算 机 之 后 的 第 二 个 里 程 碑 。 
互联 网 的 兴起 本 质 上 是 对 计算 资源 的 优化 与 整合 。 而 对 人 类 社会 分 散 计算 资源 的 整合 是 
计算 发 展 本 身 的 内 在 要 求 与 趋势 。 

本 阶段 计算 资源 再 次 集中 的 过 程 绝 不 是 对 第 一 阶段 的 简单 复制 ， 而 是 有 两 个 典型 的 
特点 。 

C1) 分 散 的 个 体 计算 资源 本 身 的 计算 能 力 急速 发 展 ， 比 如 摩尔 定律 和 其 后 的 多 核 技 
术 就 是 典型 的 应 用 。 
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(2) 个 体 计 算 资 源 被 互联 网 整合 。 而 这 种 整合 现在 也 成 了 一 个 关键 环节 ， 因 此 也 会 
不 断 地 演进 。 顺 着 上 述 两 条 思路 看 现今 的 热点 : Inte 和 AMD. 的 白热化 竞争 ， 刀 片 服务 
器 、 互 联网 宽带 、IPv6、 虚 拟 化 、 云 计算 等 均 在 上 述 思 路 覆盖 之 中 。 

4. 第 四 阶段 

2005 年 以 后 ,数据 机 房 建设 的 理念 在 发 展 的 里 程 中 也 更 加 成 熟 和 理性 ,不 断 地 超越 
原来 “机 房 ” 的 范畴 ， 日 益 演 进 为 组 织 内 部 的 支撑 平台 以 及 对 外 营运 的 业务 平台 。 数 据 
机 房 在 这 个 阶段 呈现 出 了 一 种 新 的 形态 : 数据 中 心 。 数 据 中 心 通过 实现 统一 的 数据 定义 
与 规范 的 数据 命名 ， 达 到 数据 共享 与 利用 的 目的 。 数 据 中 心 按 规模 划分 为 部 门 级 数据 中 
心 、 企 业 级 数据 中 心 、 互 联网 数据 中 心 以 及 云 计 算数 据 中 心 等 。 

一 个 典型 的 数据 中 心 常 常 跨 多 个 供应 商 的 多 个 产品 组 件 ， 包 插 主 机 设备 、 数 据 备 份 
设备 、 数 据 存 储 设备 、 高 可 用 系统 、 数 据 安 全 系统 、 数 据 库 系统 、 基 础 设施 平台 等 。 这 
些 组 件 需要 放 在 一 起 ， 确 保 它 们 能 作为 一 个 整体 运行 。 

数据 中 心 的 发 展 历程 如 表 15-1 所 示 。 


表 1S-1 数据 中 心 的 发 展 历程 





HANNON 
SUN ARMY Ae OAR 
a pase La AEA i 





em 服务 器 、 网 络 、 个 人 电脑 、 局 域 网 、 Sh hes. : 
互联 网 、 宽 带 、 | 基于 互联 网 的 IDC， 数 据 ' 
1995—2005 年 高 速 链 路 推动 大 型 UPS 和 空调 的 发 展 
2005 年 一 至 今 高 密度 、 云 计算 、| 中 小 数据 中 心 和 同 大 型 数据 | 对 更 大 容量 系统 和 更 高 系统 可 靠 
虚拟 化 中 心 合并 性 提出 要 求 ， 并 提出 PUE 的 概念 
15.1.3 ”数据 中 心 的 结构 


1. 概念 

广义 的 数据 中 心 是 企业 《机 构 ) 的 业务 系统 与 数据 资源 进行 集中 、 集 成 、 共 享 、 分 
析 的 场地 ， 是 工具 和 流程 的 有 机 组 合 。 其 核心 内 容 包 括 业 务 系统 、 数 据 ETL 
(Extraction-Transformation-Loading， 提 取 、 转 换 和 加 载 )、ODS (operational data store 可 
操作 数据 存储 ) 数据 库 、 数 据 仓库 、 数 据 集 市 、 商 务 智能 等 ,也 包括 物理 的 运行 环境 (中 
心机 房 》 和 运行 维护 管理 服务 。 具 体 来 说 它 包含 以 下 4 个 方面 的 含义 。 

(1) 数据 中 心 提 供 所 有 的 应 用 系统 〈 包 括 集中 的 业务 应 用 系统 、 数 据 交 换 平 台 、 应 
用 集成 平台 ) 的 运营 环境 。 | 

(2) 数据 中 心 是 容纳 用 以 支持 应 用 系统 运行 的 基础 设施 (包括 机 房 、 服 务 器 、 网 络 、 
存储 设备 ) 的 物理 场所 。 

(3) 数据 中 心包 括 数据 中 心 本 身 的 ODS、 数 据 仓 库 及 建立 在 其 上 的 决策 分 析 
应 用 。 

(4) 数据 中 心 有 一 套 成 熟 的 运行 和 维护 体系 ， 以 保证 应 用 系统 高 效 、 准 确 、 不 间断 
地 运行 。 
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由 上 面 可 以 看 出 ， 一 个 完整 的 数据 中 心 结构 应 该 包含 这 些 模块 : 基础 设施 、 管 理 调 
度 、 应 用 系统 、 容 灾 备 份 、IT 管理 以 及 安全 。 
数据 中 心 总 体 结 构 如 图 15-2 Aras. 





15-2 ”数据 中 心 总 体 结构 


2. 数据 中 心 的 层次 划分 

根据 数据 中 心 的 定义 和 发 展 趋势 ， 可 以 将 数据 中 心 自 底 向 上 划分 为 四 个 层次 : 

(1) 基础 设施 层 

用 统一 的 技术 将 机 房 、 通 信 、 计 算 、 存 储 等 IT 基础 资源 融合 形成 数据 中 心 的 基础 设 
施 ， 为 业务 系统 提供 基本 的 资源 服务 。 

(2) 信息 资源 层 

信息 资源 是 企业 生产 过 程 中 涉及 的 一 切 文 件 、 资 料 、 图 表 和 数据 等 信息 的 总 称 。 本 
层 存储 了 企业 《机构 ) 生产 和 经 营 活 动产 生 、 获 取 、 处 理 、 存 储 、 传 输 和 使 用 的 一 切 信 
县 资源 。 

(3) 应 用 文 撑 层 

应 用 文 撑 层 针对 不 同 应 用 的 结构 化 数据 和 非 结 构 化 数据 ， 利 用 SOA 架构 提供 数 
据 管理 、 数 据 安全 、 数 据 传送 等 数据 服务 。 其 中 ， 数 据 管 理 主要 实现 存储 资源 化 、 计 
算 资 源 化 、 网 络 资源 化 ， 并 动态 调整 资源 匹配 数据 的 读 写 存储 ; 数据 传送 包括 广 域 
网 Cwide area network, WAN) 优化 、 核 心 设 备 的 强 整 合 能 力 以 及 数据 中 心 网 络 的 
智能 化 ; 安全 服务 包括 IPS/IDS. FW 等 ， 同 时 安全 管理 中 心 实现 对 安全 的 统一 策略 
和 管理 。 

(4) 应 用 层 

应 用 层 主 要 包括 针对 结构 化 和 非 结构 化 数据 的 各 种 应 用 ， 包 括 各 种 业务 系统 、 辅 助 
决策 系统 和 各 种 多 媒体 应 用 (监控 、 流 媒体 、 统 一 通信 、 呼 叫 中 心 、 视 频 )。 

数据 中 心 的 分 层 结 构 如 图 15-3 所 示 。 
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15-3 ”数据 中 心 分 层 结构 图 


15.1.4 ”数据 中 心 的 应 用 


随 着 现代 企业 信息 化 的 蓬勃 发 展 和 办 公 自 动 化 的 推进 ， 各 业务 处 理 系统 的 开发 以 及 
数据 采集 系统 的 建成 ， 产 生 了 大 量 纷繁 复杂 的 数据 ， 而 且 数 据 量 正 以 指数 级 增长 。 如 果 
还 停留 在 对 数据 本 身 的 操作 上 ， 将 会 造成 数据 资源 的 极 大 浪费 。 数 据 中 心 的 应 用 则 能 将 
这 些 问题 迎刃而解 。 

作为 企业 内 部 数据 交换 、 存 储 、 分 析 中 心 ， 以 及 向 企业 各 部 门 传递 数据 的 一 种 工具 ， 
数据 中 心 提 供 了 一 个 获取 数据 的 平台 。 它 作为 一 个 数据 集 市 ， 对 各 业务 系统 的 数据 进行 
整合 和 优化 ， 能 实现 数据 流程 的 畅通 ， 提 供 规范 的 数据 标准 。 数 据 中 心 的 应 用 有 以 下 这 
些 方面 或 场合 。 

L. 需要 统一 、 有 效 的 数据 规范 

企业 常常 需要 对 自己 的 数据 有 统一 和 有 效 的 数据 规范 ， 而 这 时 ， 建 立 一 个 数据 中 心 
将 会 帮 上 大 忙 。 

2. 取消 全 部 或 部 分 手工 报表 

随 着 企业 的 逐渐 壮大 , 手工 报表 的 存在 会 越发 阻碍 企业 的 发 展 , 而 建立 数据 中 心 后 ， 
用 户 无 需 任何 关于 数据 库 方面 的 知识 ， 就 可 以 自行 从 中 抓 取 系统 数据 ， 并 通过 特定 工具 
定制 出 各 种 报表 。 

3. 分 离 业 务 系 统 和 数据 资源 管理 系统 

一 些 变化 较 大 、 灵 活性 较 强 的 系统 ， 如 报表 系统 、 台 账 系统 等 可 以 不 再 由 业务 系统 
开发 ， 而 是 在 数据 中 心 实现 。 这 样 ， 业 务 系统 就 能 专注 于 数据 的 生成 、 流 转 和 校 验 。 

4. 数据 的 分 析 应 用 需要 有 力 保障 

在 建立 起 数据 中 心 后 ， 用 户 随时 可 以 从 数据 中 心 抓 取 各 业务 系统 数据 进行 分 析 ， 而 
不 会 因为 频繁 读 取 数 据 库 服 务 器 的 信息 而 影响 业务 系统 的 性 能 。 
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S$， 解 决 原 有 业务 系统 数据 的 迁移 

业务 系统 可 以 不 再 保留 大 量 的 历史 数据 而 由 数据 中 心 来 统一 保存 ， 并 且 查 询 的 职能 
也 将 由 数据 中 心 承担 ， 这 样 将 能 大 大 提高 生产 指挥 系统 的 效率 ， 因 为 海量 数据 的 保存 和 
灵活 快速 的 查询 正 是 数据 中 心 的 强项 。 


15.2 ”数据 中 心 的 现状 


15.2.1 传统 数据 中 心 的 问题 


最 近 的 一 份 中 国 数 据 中 心 市 场 发 展 报告 显示 ， 目 前 中 国 数 据 中 心 市 场 的 投资 额 已 经 
达到 70 亿美 元 ， 而 在 未 来 的 $ 年 内 ， 市 场 预计 将 以 20% 的 复合 年 增长 率 增 长 。 毋 庸 置 
疑 ， 数 据 中 心 正 在 以 惊人 的 速度 高 速 发 展 ， 但 同时 也 带 来 了 一 系列 的 问题 和 挑战 ， 其 中 
最 大 的 挑战 之 一 就 是 如 何 解决 其 造成 的 巨大 能 源 消耗 。 

据 统 计 ， 我 国 现 有 各 类 数据 中 心 40 多 万 个 ， 其 能 耗 已 经 占 到 我 国 全 社会 用 电量 的 
1.5% 左 右 ， 能 源 花费 所 占 企业 数据 中 心 运营 预算 的 比例 也 已 从 8% 激 增 到 48%。 而 在 一 
项 对 于 数据 中 心 现 状 的 调查 中 发 现 ，$1% 的 企业 认为 ， 数 据 中 心 面临 着 诸如 散热 、 供 电 、 
成 本 等 问题 ; 19% 的 企业 认为 ， 其 数据 中 心 供 电 和 散热 能 力 不 足 ， 限 制 了 IT 基础 设施 的 
拓展 ， 或 无 法 充分 利用 高 密度 计算 设备 ，16% 的 被 访 企 业 认 为 ， 其 数据 中 心 的 平均 业务 
恢复 时 间 太 长 ; 还 有 14% 的 企业 认为 ， 传 统 的 数据 中 心 资源 分 散 ， 导 臻 利用 率 过 低 。 

数据 中 心 现状 调查 结果 如 图 15-4 所 示 。 

企业 眼中 传统 数据 中 心 存在 的 问题 


利用 率 低 
14% 






a 成 本 太 高 





成 本 太 高 - 
51% = 业务 恢复 时 间 长 
O 资源 分 散 ， 利 用 率 低 


图 15-4 ”数据 中 心 现状 调查 结果 
在 现 如 今 提倡 节能 减 排 的 社会 大 环境 下 ， 数 据 中 心 这 种 能 耗 大 户 无 疑 面 临 着 很 严峻 
的 形势 和 挑战 。 如 果 只 是 能 耗 问题 , 或 许 比 起 它 的 作用 来 ,传统 数据 中 心 依然 可 以 接受 。 
但 如 果 再 加 上 它 呈 几何 倍数 增长 的 运营 成 本 、 十 分 低下 的 服务 器 和 网 络 设备 使 用 效率 等 
问题 ， 大 家 就 要 开始 考虑 传统 数据 中 心 存 在 的 意义 了 。 


15.2.2 云 数 据 中 心 的 诞生 


数据 中 心 的 发 展 可 以 概括 为 经 历 了 3 个 不 同 的 时 代 ， 分 别 为 主机 时 代 、 互 联网 时 代 
和 云 计算 时 代 。 
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1. 主机 时 代 

C1) 局 域 网 架构 ， 大 、 小 型 机 构建 的 小 型 数据 中 心 。 

(2) 物理 设施 多 单 点 故障 。 

(3) 双 机 热 备 与 本 地 备份 。 

2. 互联 网 时 代 

(1) WWW 网 架构 ，X86 服务 器 参与 构建 大 型 数据 中 心 。 

(2) 集中 管理 运 维 。 

(3) 数据 中 心 异 地 备份 容 灾 。 

3. 云 计 算 时 代 

(1) 云 计算 架构 ，X86 服务 器 主流 构建 云 数 据 中 心 。 

(2) 模块 化 部 署 ， 精 细 化 管理 。 

(3) 基于 虚拟 机 容 灾 备份 。 

在 云 计算 的 概念 还 未 提出 之 前 ， 如 何 使 数据 中 心 变 得 更 加 绿色 和 环保 ， 是 企业 一 直 
在 寻求 的 解决 之 道 。 云 计算 的 出 现 ， 无 疑 为 数据 中 心 的 发 展 指明 了 新 的 道路 。 

弹性 的 资源 配置 、 超 高 的 计算 能 力 以 及 按 需 使 用 等 特性 将 成 为 改变 企业 内 部 IT 能 源 
消耗 的 关键 性 因素 , 成 本 、 灵 活性 和 敏捷 性 等 都 将 因此 得 到 改善 。 相 比 于 传统 数据 中 心 ， 
云 数据 中 心 托 管 的 不 再 是 客户 的 设备 , 而 是 客户 的 计算 能 力 和 IT 可 用 性 。 数据 在 云端 传 
输 ， 云 计算 数据 中 心 为 其 调配 所 需 的 计算 能 力 ， 并 对 整个 基础 构架 的 后 台 进 行 管理 。 

与 传统 数据 中 心 相 比 ， 云 数据 中 心 将 从 软件 、 硬 件 两 方面 进行 维护 : 软件 层面 不 断 
根据 实际 的 网 络 使 用 情况 对 云 平台 进行 调试 ， 在 硬件 层面 则 保障 机 房 环境 正常 和 网 络 资 
源 运转 调配 。 数 据 中 心 会 完成 整个 IT 的 解决 方案 ,客户 可 以 完全 不 用 操心 后 台 ， 并 能 获 
得 充足 的 计算 能 力 ( 像 家 庭 的 水 电 供 应 一 样 )。 


15.2.3 云 数 据 中 心 的 应 用 


随 着 云 计 算 概念 的 普及 和 应 用 ， 云 计算 数据 中 心 开始 被 应 用 到 各 大 厂商 之 中 。 

百度 公司 在 南京 设立 的 云 计 算数 据 中 心 ， 汇 集 了 众多 新 兴 硬 件 技术 ， 已 然 成 为 国内 最 
大 的 万 兆 集 群 ， 而 这 个 数据 中 心 最 为 瞩目 的 是 它 的 全 球 首 个 ARM 架构 服务 器 端 规模 应 用 。 

腾讯 公司 在 上 海 青浦 工业 园区 建立 的 云 计算 中 心 ， 可 为 全 国 的 互联 网 用 户 以 及 第 三 
方 企业 提供 云 平台 综合 服务 ， 该 中 心 主要 面向 华东 地 区 ， 由 三 大 中 心 互相 联动 、 辐 射 全 
国 ， 是 上 海 推进 “云海 计划 ”过 程 中 的 重大 项 目 ， 将 给 上 海 “ 云 计 算 ” 产 业 带 来 高 等 级 
的 基础 设施 、 开 放 式 的 平台 和 丰富 的 应 用 。 

还 有 最 近 才 推出 的 中 国电 信和 阿里 云 合 建 的 智慧 城市 云 数 据 中 心 。 政 府 、 企 业 及 教 
育 等 部 门 在 云 计 算数 据 中 心 上 ， 构 建 自己 的 信息 系统 ， 可 以 依托 其 强大 的 计算 能 力 和 先 
进 的 基础 设施 ， 大 大 减少 项 目 投入 、 建 设 周 期 和 后 续 维 护 成 本 。 该 云 数 据 中 心 提供 的 服 
务 包 插 云 服务 器 、 云 虚拟 空间 、 云 应 用 服务 、 移 动 云 服务 、 云 灾 备 、 泥 合 云 等 高 性 能 、 
高 可 靠 、 高 稳定 、 高 安全 的 云 服 务 。 

华为 公司 则 在 2012 年 7 月 ， 正 式 启 动 了 深圳 总 部 “万 人 桌面 云 ” 集 装 箱 数据 中 心 
项 目 。 该 项 目 作 为 华为 的 样板 工程 ， 依 据 TIER_II+ 等 级 规划 设计 ， 其 中 核心 系统 依据 
2N 架构 设计 , 一 期 工程 规划 支持 1 万 研发 人 员 使 用 桌面 云 , 二 期 将 稳定 支持 2 万 研发 人 
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员 使 用 桌面 云 ， 是 目前 世界 上 等 级 最 高 、 规 模 最 大 的 集装箱 “桌面 云 ” 数 据 中 心 之 一 。 
15.2.4 ” 云 数 据 中 心 的 优势 


云 数据 中 心 到 放 是 凭借 什么 使 它 能 解决 传统 数据 中 心 面临 的 问题 而 如 此 受 欢迎 呢 ? 

首先 是 高 度 的 虚拟 化 ， 包 括 服务 器 、 存 储 、 网 络 、 应 用 等 的 虚拟 化 ， 其 中 有 “一 虚 
多 ”， 即 一 台 服 务 器 虚拟 成 多 台 服 务 器 ， 有 “多 虚 一 ” 即 ， 多 人 台 服 务 器 处 理 同一 个 业务 ， 
更 多 的 是 “多 虚 多 ”， 即 多 个 业务 在 多 台 虚 拟 服务 器 上 运行 ， 这 样 就 可 以 使 用 户 能 按 需 调 
用 各 种 资源 ， 并 且 应 用 程序 都 可 以 在 相互 独立 的 空间 内 运行 而 互 不 影响 ， 从 而 显著 提高 
了 数据 中 心 的 工作 效率 ， 解 决 了 传统 数据 中 心 效率 低下 的 问题 。 

其 次 是 管理 上 的 差异 ， 主 要 体现 在 自动 化 方面 。 这 包括 云 数据 中 心 对 物理 服务 器 、 
虚拟 服务 器 的 管理 ,对 相关 业务 的 自动 化 流程 管理 以 及 对 客户 服务 的 收费 等 目 动 化 管理 。 
高 度 的 自动 化 有 效 降低 了 数据 中 心 的 运营 、 维 护 代价 。 

最 后 是 绿色 节能 。 云 数据 中 心 因为 虚拟 化 而 减少 了 物理 主机 数量 ， 充 分 利用 未 被 利 
用 的 计算 能 力 ， 且 扩充 方便 ， 自 动 化 程度 高 ， 不 需要 花费 大 量 人 力 、 电 力 维持 机 房 的 管 
理 和 运行 ， 从 而 节省 了 资源 消耗 ， 直 接 降低 电力 成 本 减少 碳 排放 量 ， 其 绿色 节能 的 程度 
是 传统 数据 中 心 无 法 比拟 的 。 

可 以 说 ， 云 计算 数据 中 心 的 出 现 ， 极 大 地 缓解 了 传统 数据 中 心 的 发 展 困境 。 现 在 ， 
政府 、 电 信和 运营 商 、 金 融 行业 、 大 型 互联 网 企业 等 都 在 如 火 如 茶 地 进行 云 数 据 中 心 的 建 
设 。 尤 其 是 电信 运营 商 ， 云 数据 中 心 已 健 然 成 为 各 大 运营 商 重 点 投入 的 领域 ， 对 外 ， 云 
数据 中 心 是 电信 运营 商 发 展 集团 客 户 的 重要 阵地 ; 对 内 ， 云 数据 中 心 是 电信 运营 商 发 展 
3G/4G 用 户 、 宽 带 用 户 和 互联 网 产业 的 “通途 ”。 


15.3 数据 中 心 的 构建 


15.3.1 ”数据 中 心 的 分 类 与 分 级 


按 不 同 的 标准 ， 数 据 中 心 有 不 同 的 分 类 和 分 级 方式 。 

1. 根据 数据 中 心服 务 的 对 象 和 范围 分 类 

根据 数据 中 心服 务 的 对 象 和 范围 ， 常 将 数据 中 心 分 为 企业 级 数据 中 心 和 互联 网 数据 中 心 。 

(1) 企业 数据 中 心 

企业 数据 中 心 是 指 由 企业 或 机 构 所 有 和 使 用 的 数据 中 心 ， 为 目 己 的 组 织 、 合 作 伙 伴 
和 客户 提供 数据 处 理 和 数据 访问 的 支撑 。 企 业内 部 的 IT 部 门 或 合作 方 负责 数据 中 心 设备 
的 运行 和 维护 。 企 业 数据 中 心 是 一 个 公司 内 部 网 络 、 互 联网 访问 、 电 话 服务 的 核心 。 

(2) 互联 网 数据 中 心 

互联 网 数据 中 心 是 指 由 服务 提供 商 所 有 ， 并 回 多 个 客户 提供 有 偿 的 数据 及 互联 网 服 
Z Cu Web BK VPN 服务 等 ) 的 数据 中 心 。 

2. 数据 中 心 的 等 级 划分 

业界 长 期 以 来 都 是 用 等 级 划分 的 方式 来 评估 数据 中 心 的 可 用 性 和 整体 性 能 。 最 广泛 
使 用 的 是 美国 Uptime Institute 提出 的 等 级 分 类 系统 ， 它 已 成 为 设计 人 员 在 规划 数据 中 心 
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时 的 重要 参考 依据 。 在 这 个 系统 中 ， 数 据 中 心 被 分 为 四 个 等 级 。 

(1) 一 级 机 房 一 一 容错 级 〈fault tolerant) 

任何 计划 的 活动 都 不 会 中 断 关 键 负 人 荷 ， 容 错 功能 使 机 房 基 础 设施 在 出 现 一 处 故障 或 
事件 时 , 能 维持 运转 而 不 对 IT 设备 产生 重大 影响 。 该 等 级 机 房 具 有 双 路 电源 和 冷却 系统 ， 
且 每 路 电源 有 部 件 元 余 ， 具 有 较 高 的 容错 能 力 。 

(2) 二 级 机 房 一 一 并 行 维护 级 (concurrently maintainable) 

允许 进行 任何 计划 的 机 房 基础 设施 活动 ,， 而 不 会 中 断 IT 设备 运行 。 该 等 级 机 房 具有 
双 路 电源 ， 但 每 路 没有 克 余 部 件 ， 冷 却 系统 有 部 件 见 余 ， 进 行 计划 性 的 设施 维护 不 需 关 

(3) 三 级 机 房 一 一 部 件 见 余 级 (redundant components) 

IT 设备 运行 受 计划 的 或 非 计 划 的 活动 而 中 断 的 可 能 性 较 小 。 该 等 级 机 房 具 有 单 路 电 
源 和 冷却 系统 ， 有 元 余部 件 ， 在 对 关键 供电 路 径 或 其 他 关键 基础 设施 部 件 进行 维护 时 ， 
需 关 闭 机 房 负 载 。 

(4) 四 级 机 房 一 一 基本 级 (basic) 

IT 设备 运行 容易 受 计 划 的 和 非 计 划 的 活动 中 断 。 该 等 级 机 房 具有 单 路 电源 和 冷却 系 
统 ， 无 风 余 部 件 ， 有 较 多 单一 故障 点 ， 设 施 部 件 故 障 将 导致 机 房 服 务 中 汤 。 

数据 中 心 基础 设施 的 不 同 部 分 可 以 有 不 同 的 分 级 级 别 ， 而 中 心 总 的 级 别 是 其 所 有 基 
础 设施 中 的 最 低 等 级 。 比 如 ， 如 果 一 个 数据 中 心 的 基础 设施 的 电力 部 分 是 级 别 2， 其 余 
所 有 部 分 都 是 级 别 4， 那 么 该 中 心 仍 被 评定 为 级 别 2。 


15.3.2 ”数据 中 心机 房 构 建 


1. 数据 机 房 的 构成 

要 构建 一 个 数据 中 心机 房 ， 首 先 要 了 解数 据 机 房 的 构成 。 其 次 ， 要 知道 数据 中 心机 
房 的 整体 布局 。 

数据 中 心 场地 基础 设施 是 一 个 包括 多 个 子 系统 的 集成 ， 我 们 把 基础 设施 分 为 供电 系 
统 、 制 冷 系 统 、 内 部 装修 、 机 柜 系 统 、 防 雷 / 接 地 、 消 防 系 统 、 综 合 布线 和 集成 管理 8 个 
系统 ， 每 个 系统 都 包括 若干 内 容 。 

2. 数据 中 心机 房 的 构成 

数据 中 心机 房 有 一 个 技术 指标 一 一 PUE。PUE (Power Usage Effectiveness) 概念 由 
The Green Grid (RA) 提出 ， 已 成 为 评价 数据 中 心 物 理 基 础 设施 层 〈 机 房 ) 效率 的 核心 
指标 。 其 中 











PUE= 数 据 中 心 总 用 电量 *IT 系统 用 电量 
数据 中 心 总 用 电量 =IT 系统 用 电量 + 空调 耗 电 + 供 配 电 耗 电 + 照 明 耗 电 + 其 他 
现在 PUE 的 值 一 般 为 1 一 2， 作 为 衡量 数据 机 房 的 技术 指标 ， 其 值 越 小 越 好 。 


15.3.3 ”数据 中 心 功 能 构建 


通常 ， 建 设 一 个 能 运作 的 数据 中 心 要 经 过 以 下 步骤 。 
1. 调研 及 需求 分 析 
首先 要 明确 数据 中 心 的 定位 问题 ， 它 覆盖 的 范围 有 多 大 ? 所 框 定 内 容 是 什么 ? 这 些 
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都 需要 用 户 提 前 考虑 清楚 ， 大 原则 先 定 下 来 。 具 体 的 内 容 、 形 式 和 方案 需要 通过 调研 等 
活动 完成 ， 而 调研 活动 又 可 以 通过 服务 提供 商 来 完成 具体 事项 。 通 过 调研 活动 获得 用 户 
具体 需求 ， 这 些 需求 再 不 断 地 更 新 、 确 认 。 需 求 确 定 后 ， 接 下 来 就 是 对 其 进行 分 析 ， 分 
析 包 括 以 下 几 方 面 的 内 容 。 

(1) 数据 分 类 标准 。 明 确 由 多 少 类 的 数据 构成 ， 存 在 多 少 不 同 的 逻辑 工作 区 ， 数 据 
如 何以 库 表 形 式 分 布 于 这 些 不 同 的 逻辑 工作 区 中 。 

(2) 数据 共享 内 容 。 明 确 数 据 共享 内 容 有 哪些 ， 如 何 实 现 。 

(3) 数据 特性 。 需 要 考虑 静态 数据 与 动态 数据 、 微 观 应 用 与 宏观 应 用 的 数据 共享 、 
集中 分 布 式 数 据 管理 、 数 据 源 的 异 构 性 等 。 

2. 制定 标准 及 总 体 框架 设计 

说 明 数 据 中 心 总 体 设 计 的 基本 思路 和 方法 ， 制 定数 据 中 心 的 详细 设计 方案 ， 从 长 远 
和 近期 目标 两 方面 ， 论 述 数据 中 心 的 主要 功能 和 作用 。 针 对 各 区 的 主要 特点 进行 设计 ， 
数据 流 回 清 晰 ， 并 要 考虑 数据 一 致 性 、 完 整 性 等 问题 。 明 确 标 准 的 支持 问题 ， 制 定数 据 
安全 和 用 户 权 限 策略 。 从 保证 数据 中 心 运行 的 长 期 性 、 高 效 性 、 安 全 性 出 发 ， 提 出 数据 
库 系 统管 理 和 维护 方法 ， 并 提出 数据 库 优化 设计 方案 。 接 口 数 据 文件 交换 不 规范 ， 就 不 
能 满足 数据 规范 管理 和 数据 安全 的 需求 ， 因 此 在 设计 数据 中 心 时 ， 必 须 统 一 数据 交换 模 
式 ， 制 定 规范 的 接口 数据 文件 结构 。 一 般 来 说 ， 数 据 中 心 的 设计 架构 要 考虑 几 方 面 : 可 
靠 性 、 易 用 性 、 高 效 、 可 维护 性 。 数 据 中 心 的 设计 则 包括 网 络 设计 、 安 全 设计 、 灾 备 设 
计 、 运 维 设计 等 。 

3. 平台 设计 

根据 上 面 对 数 据 中 心 的 调研 分 析 以 及 总 体 框架 设计 ， 从 先进 性 、 可 靠 性 、 安 全 性 、 
高 效 性 、 稳 定性 、 管 理 简 便 性 等 方面 综合 考虑 ， 提 出 数据 中 心 技 术 支撑 平台 设计 的 一 些 
原则 。 

(1) 在 不 考虑 网 络 平台 的 前 提 下 ， 运 行 平台 主要 包 插 关键 主机 (数据 库 和 应 用 服务 
器 )、 数 据 库 软件 、 数 据 存 储 网 络 、 数 据 备 份 、 数 据 中 心 开 发 技术 和 相关 的 工具 软件 选 型 等 。 
(2) 要 求 结构 设计 方案 具有 先进 性 、 完 整 性 、 可 靠 性 、 安 全 性 、 可 扩展 性 。 

(3) 主机 选 型 和 存储 备份 方案 具有 先进 性 、 扩 展 性 、 可 靠 性 ， 并 以 各 区 数据 量 详细 
测算 为 依据 ， 提 出 主机 和 存储 分 阶段 扩展 的 思路 和 策略 。 

(4) 对 数据 库 和 数据 仓库 的 选 型 进行 科学 论证 ， 并 对 所 采纳 的 数据 复制 和 集成 技术 
进行 比较 和 论证 。 

(5) 提供 完善 的 数据 备份 和 恢复 策略 。 

(6) 系统 必须 保证 其 功能 和 性 能 上 的 稳定 性 和 高 效率 。 

管理 简单 方便 ， 提 供 人 简单 、 方 便 的 辅助 工具 ， 减 轻 数据 管理 技术 难度 ， 减 少 人 为 错 
误 造 成 不 必要 的 损失 。 

4. 数据 库 建 设 

按 实 际 情况 ， 提 出 数据 库 建设 要 求 。 建 议 分 步 进 行 ， 先 易 后 难 ， 比 如 可 以 先 建设 基 
础 资源 数据 库 等 。 

5. 功能 实现 

就 实际 需求 ， 在 已 建设 好 的 数据 库 等 基础 设施 上 设置 交换 接口 标准 、 应 用 程序 等 ， 
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配置 应 用 系统 ， 由 简单 到 复杂 逐步 建设 ， 以 达到 实现 最 终 功能 应 用 的 目的 。 


15.4 ”数据 中 心 的 关键 技术 


现今 数据 中 心 的 热点 技术 包括 绿色 机 房 技术 、 云 计算 技术 、 数 据 中 心 网 络 技术 、 数 
据 中 心安 全 防护 技术 、 灾 备 技术 等 。 

1. 绿色 机 房 技术 

华为 的 绿色 机 房 技 术 提 供 从 咨询 设计 到 解决 方案 ， 再 到 落地 交付 产品 一 系列 的 服 
务 ， 最 终 将 建设 绿色 节能 的 云 数据 中 心 ， 达 到 节省 能 耗 的 目的 。 该 技术 的 主要 流程 为 : 
首先 提供 咨询 和 评估 的 服务 ,， 从 现场 测量 到 分 析 评 估 , 再 到 输出 报告 并 确认 供 配 电容 量 、 
制冷 容量 以 及 能 效 分 析 等 ， 随 后 提出 绿色 数据 中 心 的 解决 方案 ， 通 过 一 系列 手段 有 效 降 
低 PUE; 最 后 提供 主要 设备 ， 包 括 室 外 场景 的 集装箱 数据 中 心 和 室内 场景 的 模块 化 数据 
中 心 等 。 该 技术 的 特点 是 高 密 、 低 耗 以 及 快速 部 署 。 

2. 云 计 算 技术 

云 计 算 技术 运用 在 数据 中 心中 至 少 有 以 下 优点 。 

C1) 高 效 。 存 储 利用 率 >40%《【 传 统 数据 中 心 为 23% 一 30%)， 内 存 利用 率 >$0% k 
统 数据 中 心 约 为 30%)， 虚 拟 化 性 能 损耗 <5%。 

(2) 开放。 具有 兼容 主流 的 服务 器 和 统一 管理 主流 的 虚拟 化 平台 。 支持 Amazon API, 
双 音 多 频 (dual tone multi frequency, DMF). 

(3) 自动 化 。 

(4) 智能 资源 调度 。 

(5) 自动 化 部 署 。 也 正 是 因为 这 一 系列 的 优点 催生 了 云 数 据 中 心 的 诞生 。 

3. 数据 中 心 网 络 技术 

数据 中 心 内 部 核心 网 络 架 构 采 用 扁平 化 二 层 网 络 架 构 〈 核 心 屋 、 接 入 层 )， 使 用 网 
络 虚 拟 化 技术 ， 核 心 层 交换 机 承担 着 核心 屋 和 汇聚 层 的 双重 任务 。 核 心 层 采 用 CSS 虚拟 
集群 技术 ， 将 两 台 或 多 台 核 心 交 换 机 虚拟 为 一 台 设 备 ， 接 入 层 采 用 堆 释 技术 ， 将 两 台 或 
多 台 接 入 交换 机 虚拟 为 一 台 设 备 ， 两 种 技术 都 是 设备 背 板 共享 ， 提 高 交换 能 力 。 

在 局 平 化 二 层 网 络 架 构 中 ， 虚 拟 集群 和 堆 登 技术 的 使 用 ， 解 决 了 链 路 环 路 问题 和 
spanning-tree 收敛 问题 ， 简 化 了 二 层 链 路 环 路 ， 提 高 了 链 路 利用 率 和 网 络 的 可 靠 性 。 

4. 数据 中 心安 全 防护 技术 

华为 在 数据 中 心安 全 防护 上 也 推出 了 自己 的 业务 。 华 为 的 可 信 云 计算 和 可 信 云 存储 
WS, 针对 IT 业务 流程 中 潜在 的 安全 风险 设计 了 有 效 的 保障 措施 ,同时 通过 一 些 显 性 化 
的 安全 设计 让 用 户 可 以 感知 到 业务 的 可 信 。 

例如 在 用 户 认 证 的 环节 上 ， 华 为 采用 了 和 银行 同样 的 USBkey 双 因 素 认 证 的 方式 ， 
这 样 不 仅 提 高 了 身份 认证 的 安全 性 ， 并 且 对 于 用 户 来 说 ， 安 全 可 信和 实体 化 可 感知 ， 而 不 
再 是 一 堆 眼 花 综 乱 的 专业 术语 。 

加 密 的 环节 则 可 以 在 USBkey 中 存储 加 密 密 钥 和 加 密 算法 ， 对 用 户 在 IDC 中 的 数据 
和 磁盘 进行 高 等 级 的 透明 加 密 ， 这 样 即使 数据 甚至 硬盘 落 入 别有用心 的 人 手中 ， 也 不 用 
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担心 数据 泄露 。 

通过 强化 身份 认证 、 数 据 和 全 盘 加 密 以 及 日 志 集中 审计 的 有 机 结合 ， 可 信 云 业务 实现 
了 非法 用 户 “ 进 不 去 ” 业务 数据 “不 怕 丢 ” 全 业务 流程 环节 “和 赖 不 掉 ” 的 安全 可 信和 保障 。 

$.， 灾 备 技术 

数据 中 心 运 行 的 不 间断 性 对 于 一 个 商业 组 织 的 成 功 运作 起 着 非常 重要 的 作用 。 特 别 
是 对 于 电子 商务 、 金 融 服务 领域 来 说 ， 如 果 数 据 无 法 被 访问 ， 每 分 钟 就 会 造成 几 十 万 
上 百 万 美元 的 损失 。 因 此 ， 必 须 有 可 靠 的 备份 机 制 与 成 熟 的 备份 技术 来 保障 数据 随时 
可 访问 。 

灾 备 技术 就 是 当 数 据 中 心 因 灾难 不 能 工作 时 ， 用 备份 的 副本 在 第 二 地 点 恢复 数据 。 
容 灾 备份 是 非常 重要 的 环节 ， 它 既 保证 了 生产 系统 的 数据 尽 可 能 少 的 丢失 ， 又 保持 生产 
系统 的 业务 不 间断 运行 ， 这 不 仅 能 避免 灾难 带 来 的 数据 损失 ， 而 且 保证 了 生产 系统 效率 
的 持续 性 。 容 灾 备 份 通常 将 数据 同时 保存 在 地 理 位 置 相互 隔离 的 多 个 数据 中 心里 ， 以 保 
证 在 一 个 地 点 出 现 不 可 避免 的 数据 灾难 时 ， 男 一 数据 中 心 的 数据 备份 系统 能 够 迅速 接管 
正在 执行 的 工作 ， 保 障 系统 运作 的 正常 进行 。 


15.5 ”华为 数据 中 心 解决 方案 


在 数据 中 心 的 设计 和 解决 方案 上 ， 华 为 公司 也 有 上 自己 一 整套 完备 的 体系 。 下 面 介绍 
华为 最 有 代表 性 的 几 种 数据 中 心 方案 。 


15.5.1 ”数据 中 心 整 合 解决 方案 


1. ee 

传统 数据 中 心 由 于 过 于 散乱 ， 面 临 着 资源 利用 率 低 、 信 息 共 享 难 、 管 理 能 力 弱 、 
业务 上 线 慢 、 能 耗 高 、 维 护 成 本 高 等 问题 。 从 分 散 型 的 数据 中 心 ， 到 集中 型 具有 业务 
灾 备 能 力 的 数据 中 心 ， 以 及 基于 虚拟 化 的 绿色 数据 中 心 ， 数 据 中 心 整 合 已 经 成 为 大 势 
所 趋 。 

华为 任 借 丰富 的 专业 技能 和 经 验 ， 为 客户 提供 数据 中 心 整合 服务 ， 场 景 涵盖 了 数据 
中 心 的 迁移 、 扩 容 、 整 合 。 

2. 解决 方案 

华为 数据 中 心 整合 解决 方案 包括 以 下 几 点 。 

(1) 网 络 架 构 整 合 、 网 络 融合 整合 、 多 数据 中 心 网 络 整合 。 

(2) 服务 器 的 物理 整合 和 逻辑 整合 。 

(3) 存储 整合 。 

(4) 安全 整合 。 

(5) 数据 中 心 管理 整合 。 

(6) 数据 中 心 绿色 节能 整合 。 

(7) 数据 中 心 评估 服务 架构、 网络 、 服 务 器 、 存 储 安 人 全、 机房 、 管 理 。 

(8) BATA: 信息 采集 工具 、 容 量规 划 工 具 、 迁 移 工具 。 
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华为 数据 中 心 整合 解决 方案 的 客户 价值 (SMART) WF. 

(1) Simple (HFH): 架构 简洁 、 管 理 简 单 、 扩 展 简 便 、 使 用 方便 。 

(2) Manageable (TEH): 多 数据 中 心 统 一 管理 、 业 务 自动 部 署 、 轻 量 级 管理 和 
增强 型 管理 平台 随 需 可 选 。 

(3) Agile( 敏 捷 灵 活 的 ); 业务 高 峰 资源 自动 增加 ， 业 务 空闲 资源 自动 回收 ， 系 统 
具有 模块 化 扩展 能 力 。 

(4) Reliable (ÆR): WATIE KFR RLR KERM EDME, 
防 患 未 然 。 

(5) Trusted 〈 可 信 的 ): 数据 加 密 ， 安 全 隔离 ， 开 放 合 规 ， 授 权 访问 。 模 块 化 端 到 
端 安全 方案 随 需 可 选 。 


15.5.2 MicroDC 解决 方案 


华为 提供 的 MicroDC 解决 方案 是 集成 了 机 房 、IT 设施 、 办 公 通 信和 与 集成 管理 软件 
的 一 体 化 微 数 据 中 心 , 是 可 以 实现 机 房 环境 与 IT 设施 统一 监控 管理 的 产品 。 通过 设备 预 
安装 可 实现 业务 快速 部 署 ， 通 过 远程 监控 功能 实现 集团 统一 管理 、 分 支 机 构 无 人 值守 。 

2. 解决 方案 

MicroDC 解决 方案 是 华为 提供 的 面向 集团 、 政 府 分 支 机 构 和 中 小 企业 的 一 体 化 解决 
方案 。 不 同 客户 需要 解决 的 诉求 也 是 不 一 样 的 。 中 小 企业 主要 是 为 了 实现 一 柜 式 部 团 ， 
实现 业务 的 快速 上 线 ， 大 型 集团 的 分 支 机 构 主 要 是 为 了 实现 IT 统一 规划 、 统 一 管控 。 

华为 是 业界 唯一 一 家 提供 端 到 端 解决 方案 的 厂家 ， 履 盖 了 云 OS、 云 管理 以 及 针对 
云 优化 的 所 有 硬件 设施 ， 可 以 让 所 有 组 件 之 间 无 颖 集成 ， 并 达到 最 优 配 置 ， 发 挥 最 大 的 
性 能 。 而 MicroDC 解决 方案 正 是 为 了 华为 各 种 自 研 产品 集成 的 打包 销售 ， 该 解决 方案 实 
现 了 各 个 产品 的 大 集成 ， 充 分 考虑 了 彼此 的 对 接 关 系 ， 并 能 做 到 最 佳 的 匹配 ， 确 保 这 些 
组 件 之 间 的 集成 与 整合 能 够 具备 更 佳 的 性 能 、 更 高 的 可 靠 性 、 更 小 的 系统 磨损 。 华 为 具 
有 较 强 的 集成 能 力 与 交付 能 力 ， 可 以 根据 客户 需求 将 该 组 合 解决 方案 打 散 ， 其 中 的 大 部 
分 产品 可 以 替换 为 其 他 友 商 的 产品 ， 并 依然 有 能 力 做 到 这 些 产 品 的 无 缝 集 成 来 充分 满足 
其 不 同 的 应 用 场景 ， 满 足 客户 的 需求 。 

当然 MicroDC 解决 方案 不 仅仅 是 产品 的 集成 , 更 重要 的 也 体现 在 各 个 构件 设计 的 合 
理性 、 成 本 价格 上 。 该 解决 方案 基于 标准 化 、 模 块 化 设计 ， 兼 容 行业 标准 与 事实 标准 ， 
不 仅 可 以 集成 现 有 网 络 上 的 设备 ， 而 且 可 以 集成 第 三 方 的 厂商 设备 ， 其 提供 的 开放 API 
也 可 以 便于 其 他 应 用 程序 厂商 的 系统 运行 在 经 过 集成 的 设备 上 。 

MicroDC 解决 方案 实现 了 摄像 头 和 温度 、 湿 度 、 烟 感 等 传感器 的 预 安装 ， 其 支架 可 
以 伸缩 ， 以 适应 各 种 场景 。 同 时 该 方案 集成 了 华为 自主 研发 的 SSMC， 将 数据 、 告 警 等 
集中 上 报 进行 统一 管理 ， 实 现 远程 运 维 。 

(1) 统一 管理 : 集团 实现 分 支 机 构 IT 设备 标准 化 ,分支 机 构 无 人 值守 ; 统一 集中 管 
理 各 地 机 房 、IT 设施 ， 降 低 运 维 成 本 30%。 

(2) RERE: 通过 机 房 中 IT 设施 的 预 安装 和 本 地 部 署 向 导 ， 实 现 一 天 内 设备 上 电 
和 系统 上 线 。 
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(3) 业界 第 一 款 ICT 一 体 化 融合 数据 中 心 ， 一 次 集成 所 需 IT 与 电信 通信 功能 。 华 
为 MicroDC 解决 方案 如 图 15-5 所 示 。 







语音 VOIP 


CAN 


计算 与 存储 — ~ 
WAN/WLAN 
15-5 46% MicroDC 解决 方案 


15.5.3 ” 云 园 区 数据 中 心 解决 方案 


华为 云 园 区 数据 中 心 解 决 方案 革命 性 地 创新 园区 IT 架构 ,基于 云 数据 中 心 建设 新 型 
的 数字 化 、 智 能 化 园区 ， 提 供 全 面 的 园区 内 部 管理 服务 和 外 部 业务 ， 促 成 园区 高 效 、 快 
速 引 入 企业 ， 推 动 园 区 企业 发 展 ， 从 而 实现 园区 本 身 的 快速 成 长 。 

华为 云 园 区 解决 方案 提供 从 园区 咨询 、 规 划 到 建设 的 一 站 式 服 务 ， 通 过 统一 管理 
及 运营 平台 实现 园区 IT 资源 池 化 、 园 区 企业 业务 云 化 、 提 供 园 区 内 部 管理 及 对 外 服 
务 所 需 的 各 种 业务 能 力 ， 促 进 园区 企业 信息 化 高 速 发 展 ， 提 升 园区 整体 竞争 力 及 发 展 
速度 。 

1. 基础 架构 

云 园 区 数据 中 心 解决 方案 基础 架构 由 三 层 组 成 如 图 15-6 所 示 。 

(1) 资源 池 层 : 提供 基础 的 物理 资源 ， 包 括 存 储 资 源 、 计 算 资源 (服务 器 )、 网 络 
资源 、 安 全 资源 及 兼容 传统 数据 中 心 的 机 位 资源 等 多 种 物理 资源 ， 物 理 资源 可 通过 虚 
拟 平台 云 化 后 成 为 云 资 源 池 ， 由 云 监控 管理 平台 管理 、 调 用 ， 通 过 云 运 营 服 务 平台 提 
供 服 务 。 

(2) FEE: 实现 物理 资源 池 的 云 化 , 通过 监控 管理 平台 和 运营 服务 平台 提供 运 维 、 
运营 服务 ， 支 撑 业 务 运 营 。 

(3) 业务 应 用 层 : 包括 园区 支撑 类 业务 、 园 区 办 公 类 业务 、 园 区 服务 业务 三 大 类 ， 
满足 园区 本 身 的 建设 和 发 展 需求 ， 并 对 园区 内 部 企业 提供 多 种 云 业 务 和 服务 。 

2. 园区 业务 

园区 业务 由 三 部 分 构成 。 

(1) 园区 支撑 云 : 园区 安防 管理 、 物 业 管 理 等 园区 本 身 支 撑 、 运 作 发 展 所 需 的 各 类 
文 撑 业务 服务 ， 包 括 园 区 物业 管理 、 园 区 项 目 建设 管理 、 园 区 企 钥 化 平台 、 园 区 智能 监 
控 、 智 能 停车 等 各 类 文 撑 园 区 本 身 运作 、 发 展 的 基础 支撑 类 业务 。 
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(2) 园区 办 公 云 : 根据 入 驻 园 区 的 不 同 规模 、 类 型 的 企业 IT 建设 需求 ， 提 供 丰 富 多 
样 的 各 类 企业 IT 服务 ， 从 基本 的 云 数 据 中 心 资 源 出 租 〈 如 机 位 、 机 架 、 云 服务 器 、 云 存 
储 等 ) 到 企业 办 公所 需 的 各 类 业务 服务 ， 如 统一 通信 、 办 公 自 动 化 、 企 业 邮 件 、 云 桌面 、 
财务 、 人 力 资源 等 各 类 业务 服务 。 

(3) 园区 服务 云 : 基于 华为 统一 运营 文 撑 平 台 ， 与 园区 周边 政府 、 工 商 、 生 活 等 各 
类 机 构 对 接 ， 对 入 驻 的 企业 及 相关 人 员 提 供 全 面 的 服务 ， 包 括 通过 信息 门户 提供 园区 各 类 资 
讯 ， 通 过 园区 一 卡通 实现 园区 无 障碍 通行 及 交易 管理 ， 通 过 园区 政务 服务 提供 企业 资质 及 各 
类 政府 相关 手续 管理 ， 通 过 金融 服务 提供 中 小 企业 融资 交易 渠道 ， 通 过 生活 服务 为 园区 内 的 
企业 员工 及 其 家 属 以 及 来 往 园 区 的 各 类 办 公 、 业 务 人 员 提 供 贴心 的 衣食 住 行 及 休闲 商务 类 服 
务 等 。 


156 ”本章 总 结 


本 章 主要 介绍 了 以 下 知识 点 。 

数据 中 心 的 发 展 背景 和 历史 意义 。 

数据 中 心 的 定义 和 结构 。 

传统 数据 中 心 面临 的 问题 以 及 云 数 据 中 心 出 现 的 意义 。 
主流 厂商 云 数 据 中 心 的 应 用 。 

数据 中 心 建 设 的 基本 流程 和 分 类 。 

数据 中 心 的 几 个 重要 技术 。 

华为 推出 的 几 种 数据 中 心 解决 方案 。 


15.7 练习 题 


一 、 选 择 题 
1. 传统 数据 中 心 面临 的 问题 不 包括 下 列 哪 一 项 ? (  ) 

A. 高 能 耗 B. 低 效 率 C. 只 提供 计算 能 力 D. 高 运营 成 本 
ZR (C) 


2. 促使 IT 和 CT 走向 ICT 融合 的 是 Je 

A. 数据 中 心 B. 存储 技术 C. 服务 器 技术 D. 云 计 算 
EFR (A) 
3. 美国 Uptime Institute 提出 的 等 级 分 类 系统 将 数据 中 心 分 为 〈 Ji 


A. 2 个 等 级 B. 3 个 等 级 C. 4 个 等 级 D. 5 个 等 级 
ZR (C) 
4. 下 列 不 属于 网 络 数据 中 心 (IDC) 总 体 架 构 的 模块 是 ( 33 

A. 业务 层 B. 平台 层 C. 网 络 层 D. 物理 层 


答案 (A) 
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5. 华为 数据 中 心 整合 解决 方案 不 包括 下 列 哪 项 ? ( ) 
A. 存储 整合 B. 应 用 整合 C. 数据 中 心 管理 整合 D. 安全 整合 
答案 (D) 


二 、 简 答题 

1. 数据 中 心 可 以 应 用 到 哪些 场景 之 中 ? 

2. 云 数据 中 心 如 何 解决 传统 数据 中 心 遇 到 的 问题 ? 

3. 相 比 于 普通 的 数据 中 心 ， 华 为 推出 的 各 种 数据 中 心 解 决 方案 分 别 具 有 什么 
特点 ? 


-加 ONEN 
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IT 运 维 管理 挑战 

IT 数据 中 心 统一 运 维 管理 
华为 ICT 管 理 的 实现 与 应 用 
本 章 总 结 

练习 题 
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关于 本 章 


本 章 主 要 介绍 IT 运 维 管理 的 相关 知识 ， 包 括 IT 运 维 管理 的 基本 概念 、IT 运 维 管理 现今 
的 局 面 和 面临 的 挑战 、IT 数 据 中 心 统一 运 维 管理 的 标准 和 实现 ， 及 华为 ICT 管 理 的 实现 与 
应 用 。 
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16.1 IT 运 维 管理 挑战 


16.1.1 IT 运 维 管理 概述 


IT 运 维 管理 是 指 在 网 络 的 基础 设施 建设 完成 并 投入 使 用 之 后 ,IT 部 门 制定 相关 流程 
文档 ， 采 取 相 关 管 理 办 法 ， 运 用 一 定 的 技术 手段 ， 对 系统 运行 环境 《〈 如 软 硬 件 环境 ， 网 
络 状 态 )、 业 务 系统 和 系统 维护 人 员 进 行 综合 管理 。 

IT 运 维 管理 主要 包含 以 下 7 方面 的 内 容 。 

(1) 设备 管理 : 对 主机 、 服 务 器 和 网 络 设备 进行 实时 监控 和 管理 ， 确 保良 好 的 运行 
状况 。 

(2) 储存 容 灾 管理 : 保证 数据 储存 安全 性 ， 管 理 者 有 能 力 对 业务 数据 进行 储存 、 备 
份 和 恢复 。 

(3) 信息 安全 管理 : 对 信息 安全 进行 动态 、 全 面 、 有 效 的 管理 ， 以 保持 信息 的 保密 
性 〈confidentiality)、 完 整 性 〈integrity) 和 可 用 性 (availability). 

(4) 应 用 服务 管理 :对 相关 支持 平台 、 软 件 、 服 务 的 监控 管理 ， 如 对 邮箱 服务 、 数 
据 库 软件 相关 的 监控 管理 等 。 

(5) 资产 管理 ;管理 整个 企业 中 IT 系统 的 资源 资产 ， 包 含 公共 信息 。 

(6) 业务 管理 : 对 企业 内 部 IT 相关 业务 进行 监控 与 管理 ， 包 含 业务 质量 监控 、 业 务 
分 析 定 位 、 业 务 开 通 支 撑 和 商业 建议 等 。 

(7) 日 党 工作 管理 : 规范 和 明确 运 维 人 员 的 在 岗 职 责 ， 提 供 绩效 考核 量化 依据 ， 提 
供 员 工 的 培训 与 日 常 问 题解 决 经 验 。 采 取 激 励 调动 运 维 人 员 的 工作 积极 性 。 


16.1.2 ”传统 数据 中 心 面临 的 挑战 


数据 中 心 又 称 服 务 器 场 ， 是 一 套 复杂 的 设施 ， 包 括 计算 机 系统 设备 、 元 余数 据 通 信 
连接 、 环 境 控制 设备 〈 如 空调 、 灭 火器 )、 监 控 设 备 和 安全 装置 等 ， 如 图 16-1 所 示 。 一 
方面 , 数据 中 心 将 具有 相同 环境 要 求 以 及 安全 需求 的 设备 集中 安置 以 便 维护 , 男 一 方面 ， 
通过 对 设备 功能 的 集成 ， 数 据 中 心 可 以 同 用 户 提 供 更 高 层次 的 应 用 与 服务 。 

在 现今 社会 ， 几 乎 所 有 的 大 中 型 机 构 〈 如 政府 部 门 、 企 业 院 校 等 ) 都 建立 了 数据 中 
D, 用 以 管理 目 己 的 IT AS. 企业 级 数据 中 心 提 供 企 业 的 信息 资源 管理 、 企 业 核 心计 算 、 
信息 资源 服务 等 功能 。 从 职责 上 来 看 ， 数 据 中 心包 含 从 最 底层 服务 器 基础 设施 布设 ， 到 
PaaS (platform-as-a-service)， 再 到 应 用 和 SaaS (software-as-a-service)， 承 载 着 IT WE 
各 层面 的 请 求 。 可 以 说 ， 数 据 中 心 在 信息 系统 中 已 经 逐渐 处 于 核心 地 位 。 

虽然 数据 中 心 的 功能 越 来 越 强 大 、 地 位 越 来 越 重要 ， 但 是 其 自身 的 一 些 问 题 也 逐渐 
暴露 出 来 。 研 究 报告 指出 : 2006 年 全 球 数据 中 心 能 源 消耗 比 2000 年 增长 了 一 倍 , 到 2012 
年 ， 数 据 中 心 能 源 消耗 再 次 翻番 。 对 于 传统 数据 中 心 来 说 ， 解 决 数据 中 心 高 能 耗 已 经 是 
一 项 严峻 的 考验 。 事 实 上， 现今 传统 数据 中 心 正面 临 着 运营 成 本 高 、 能 源 消耗 不 合理 、 
整合 困难 、 平 台 化 缓慢 四 大 挑战 。 
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门禁 和 监控 设备 。 结构 化 布线 系统 
机 房 装修 和 接地 等 
16-1 数据 中 心 模型 
1. 运营 成 本 不 断 增加 


数据 中 心 的 运营 成 本 是 指数 据 中 心 在 运营 维护 方面 需要 支出 的 开销 ， 主 要 包括 以 下 
几 个 方面 。 

(1) 房屋 建筑 成 本 和 土地 成 本 的 开销 。 

(2) 设备 成 本 ， 包 括 设备 购买 成 本 或 租金 。 

(3) 支持 设备 工作 的 水 电 等 能 源 开 销 。 

(4) 网 络 通信 费 用 ， 如 互联 网 通信 、 电 话 通信 和 专线 通信 等 费用 。 

(5) 管理 成 本 ， 包 括 日 常 办 公 管理 费用 〈 如 交通 费 、 差 旅费 等 ) 和 人 力 资源 成 本 。 

(6) 保险 和 维修 费用 。 

(7) 相关 税 费 和 财务 费用 。 

其 中 ， 数 据 中 心 建设 成 本 与 数据 中 心 能 源 消耗 为 运营 成 本 主体 。 

从 规模 上 来 看 ， 随 着 IT 行业 对 数据 处 理 要 求 的 不 断 提 高 ， 数 据 中 心 的 规模 必 将 不 断 扩 
大 。 美 国 研究 公司 IDC 指出 : 全 美 数据 中 心 规模 将 出 现 显 著 增 长 ， 从 2013 年 初 的 6.114 亿 
平方 英尺 增加 到 2016 年 的 7 亿 英 尺 以 上 。 国 内 数据 中 心 虽然 从 规模 上 来 讲 不 及 国外 ， 但 是 
随 着 IT 业 的 发 展 和 政策 的 支持 , 国内 数据 中 心 也 将 迎 来 一 次 发 展 高 潮 , 规模 的 扩大 已 成 必然 。 

数据 中 心 规模 的 扩大 ， 意 味 着 服务 器 也 将 不 断 增 加 ， 同 时 ， 机 房 的 不 断 扩 大 ， 也 对 
空调 制冷 、 火 灾 监 控 、 机 房 布 线 提 出 了 更 高 的 要 求 ， 维 持 设 备 正 常 工作 所 需 的 能 源 费 用 
不 断 上 升 ， 另 一 方面 ， 机 群 规模 的 扩大 ， 也 会 使 维护 系统 的 工作 变 得 更 加 繁琐 ， BRS 
致 了 管理 人 员 的 增加 ， 管 理 费 用 也 呈 上 升 趋势 。 综 上 ， 数 据 中 心 的 运营 成 本 直线 上 升 。 

从 能 源 消 耗 来 看 ， 数 据 中 心 的 主要 能 源 消耗 表现 为 电力 消耗 。 现 今 国 内 大 多 数 企 业 
的 数据 中 心 电 力 成 本 为 每 年 几 百 万 元 ， 很 多 已 经 超过 于 万 元 ， 巨 型 数据 中 心 的 电力 开销 
更 是 数 以 亿 计 ， 随 着 数据 中 心 的 发 展 ， 这 些 数字 更 有 增加 之 势 ， 电 力 成 本 已 经 逐渐 成 为 
制约 数据 中 心 规模 扩大 的 瓶颈 。 除 电力 成 本 外 ， 数 据 中 心 的 发 展 在 能 源 方面 仍然 受到 制 
约 一 很 多 地 区 的 电力 供应 已 经 达到 饱和 ， 无 力 文 持 数据 中 心 的 扩建 ， 这 一 点 直接 对 数据 
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中 心 的 可 用 性 和 经 济 性 造成 了 影响 ， 世 界 范 围 内 数据 中 心 在 服务 器 、 能 源 与 制冷 `- 大 员 
管理 方面 的 消耗 如 图 16-2 所 示 。 


得 入 电力 o 到达 VT 设备 的 
| 电力 





图 16-2 数据 中 心中 电力 的 使 用 情况 以 及 PUE 计算 


2. 能 源 消耗 结构 需要 调整 

高 额 的 能 源 费 用 使 得 传统 数据 中 心 的 运营 成 本 居 高 不 下 。 从 能 源 利用 的 角度 来 看 ， 
数据 中 心 不 仅 要 提供 IT 设备 负载 所 需 的 电力 ， 也 要 提供 制冷 、 照 明 、 消 防 、 监 控 设 备 等 
所 需 的 电力 。 通 常 使 用 电源 使 用 效率 (power usage effectiveness, PUE) 来 衡量 数据 中 心 
的 能 源 使 用 效率 ， 如 图 16-2 所 示 。 

目前 ， 业 界 平 均 PUE 为 2.5， 先 进 的 绿色 数据 中 心 可 以 将 PUE 控制 在 1.3 左右 。 传 
统 数据 中 心 当前 面临 的 主要 问题 是 很 多 企业 不 重视 物理 环境 布局 ， 布 局 和 供电 系统 的 不 
合理 致使 能 源 浪费 严重 ; 因 布 局 错误 使 得 机 房 局 部 温度 过 热 , 也 带 来 了 严重 的 安全 隐患 。 

从 电力 消耗 上 来 看 ，IDC 的 一 份 报 告 指出 : 在 亚太 地 区 ， 数 据 中 心服 务 器 的 电力 消 
耗 以 每 年 23% 的 速度 增长 ， 远 超 世 界 16% 的 平均 水 平 。 面 对 电力 消耗 增长 快 这 一 现状 ， 
加 强 数 据 中 心 运 维 管理 ， 通 过 多 种 方法 降低 PUE， 打 造 绿色 数据 中 心 ， 是 当前 企业 需要 
考虑 的 问题 。 

3. 数据 中 心 需要 整合 

目前 , 许多 常规 的 数据 中 心 均 构 建 在 独立 的 IT 技术 之 上 , 信息 缺乏 统一 的 标准 , 在 
这 种 技术 环境 中 ， 系 统 之 间 无 法 相互 通信 ， 而 且 由 于 无 法 共享 资源 ， 致 使 服务 器 与 储存 
性 能 都 得 不 到 充分 利用 。 另 一 方面 ， 大 型 政府 机 关 的 不 同 部 门 也 会 自 建 数据 中 心 ， 造 成 
资源 大 量 闲 置 ， 投 资 重复 。 调 查 显示 ， 很 多 企业 数据 中 心中 的 服务 器 和 网 络 设备 的 利用 
RILE 24% 一 30%， 部 分 设备 的 CPU 利用 率 、 硬 盘 利用 率 都 在 10% 以 下 。 设 备 的 利用 率 
低下 直接 导致 了 工作 效率 的 下 降 ， 为 了 将 工作 效率 维持 在 比较 高 的 水 平 ， 企 业 不 得 不 提 
高 部 署 设备 的 成 本 。 

资源 利用 率 的 低下 间接 导致 了 整体 成 本 的 提高 ， 因 此 ， 必 须 通过 整合 数据 中 心 的 手 
段 来 解决 资源 利用 率 问 题 。 常 见 的 整合 手段 包括 : 合并 储存 服务 器 、 数 据 类 型 规范 、 数 
据 中 心服 务 合并 、 应 用 平台 化 等 。 

除了 物理 方面 的 整合 以 外 ， 云 整合 储存 是 现今 数据 中 心 整合 的 一 个 有 效 手 段 。 将 数 
据 储 存 所 需 的 硬件 资源 转换 到 云 计算 ， 硬件 单元 只 作为 系统 接 入 点 ， 通 过 数据 中 心虚 拟 
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化 方式 ， 数 据 与 硬件 完全 分 离 ， 储 存在 平台 提供 的 云 系统 内 。 云 整合 储存 面临 的 主要 问 
题 是 数据 不 会 停止 增长 ， 储 存 成 本 将 不 断 提 高 ， 并 在 一 段 时 间 内 遭遇 瓶颈 。 

4， 数 据 中 心 需要 平台 化 | 

传统 数据 中 心 缺 乏 统一 开放 的 平台 ， 无 法 实现 资源 的 统一 调度 ， 不 能 支持 多 样 化 应 
用 ， 导 致 了 大 多 数 传统 数据 中 心 只 能 定制 自己 相关 的 软件 服务 。 另 一 方面 ， 因 为 各 自 技 
术 的 差异 性 ， 数 据 中 心 的 维护 也 难以 标准 化 ， 这 无 形 中 增加 了 维护 成 本 。 

传统 数据 中 心 业务 部 署 需要 从 底层 做 起 ， 基 础 配置 繁 珊 ， 新 业务 上 线 周期 难以 令 人 
满意 ， 增 值 服务 成 本 高 。 平 台 化 的 提供 数据 中 心服 务 ， 一 方面 节省 运 维 成 本 ， 另 一 方面 
支持 多 样 化 应 用 软件 服务 是 今后 数据 中 心 发 展 的 主流 。 


16.2 IT 数据 中 心 统 一 运 维 管理 


16.2.1 运 维 管理 的 标准 


随 着 数据 中 心 用 户 的 不 断 增 加 , 规模 的 不 断 扩大 , 采取 单一 的 IT 技术 并 不 能 解决 运 
维 数据 中 心 过 程 中 出 现 的 全 部 问题 , 管理 数据 中 心 需 要 更 加 专业 的 知识 和 系统 化 的 方法 。 
制定 科学 合理 的 管理 标准 ， 有 助 于 数据 中 心 建立 全 面 、 行 之 有 效 的 管理 体系 ， 提 升 数据 
中 心 的 管理 能 力 ， 从 而 提高 竞争 力 。 

(1) ISO 9001 标准 

ISO 9001 是 迄今 为 止 世界 上 最 成 熟 的 质量 管理 框架 , 最 新 版 为 2008 年 修订 版 。《ISO 
9001 质量 管理 体系 要 求 》 为 数据 中 心 的 管理 提供 了 成 熟 有 效 的 框架 ， 从 诸多 领域 对 数据 
中 心 提出 了 管理 要 求 ， 包 含 数 据 中 心 人 员 管 理 、 数 据 中 心 基础 设施 管理 、 数 据 中 心 环境 
管理 、 服 务 设 计 过 程 、 客 户 体验 管理 ， 等 等 ， 涵 盖 了 大 部 分 的 实际 运 维 情况 。 

(2) ISO 27001 标准 

信息 安全 管理 实用 规则 ISO/TEC 27001 标准 由 英国 标准 协会 于 1995 年 提出 , 最 新 版 
为 2005 年 修订 版 ， 强 调 信 息 安 全 的 机 密 性 〈confidentiality)、 完 整 性 〈integrity) 和 可 用 
性 (availability)。 通 过 建立 信息 安全 管理 体系 方针 ， 制 定 (plan)、 实 行 (dod. MR 
(check)、 改 进 (action) 流程 这 一 PDCA 循环 〈 也 称 戴 明 循环 )， 持 续 改 进 数据 中 心 信 
县 安全 管理 水 平 ， 使 数据 中 心 的 管理 体系 可 以 不 断 适 应 客户 与 组 织 内 部 发 展 的 需要 。 

(3) 信息 技术 基础 架 库 (information technology infrastructure library, ITIL) 

ITIL 由 英国 政府 部 门 CCTA (Central Computing and Telecommunications Agency) 在 
20 世纪 80 年 代 末 制订 , 目前 是 第 三 版 。 ITIL 包括 了 一 系列 适用 于 所 有 IT 组 织 的 最 佳 实 
践 ， 通 过 服务 级 别 协议 〈service level agreement, SLA) 来 保证 IT 服务 的 质量 , AGH 
置 管理 、 变 更 管理 、 发 布 管理 、 事 件 管理 、 问 题 管理 、 服 务 级 别管 理 、 财 务 管 理 、 可 持 
续 性 管理 、 容 量 管理 和 可 用 性 管理 的 管理 方法 。 

ITIL 的 核心 模块 是 “服务 管理 ” 这 个 模块 一 共 包 括 了 10 个 流程 和 一 项 职能 ， 这 些 
流程 和 职能 又 被 归结 为 两 大 流程 组 ， 即 “服务 提供 ”流程 组 和 “服务 支持 ”流程 组 。ITIL 
的 服务 提供 模块 覆盖 了 规划 和 提供 IT 服务 所 需 的 过 程 ， 包 括 服务 级 别管 理 、 财 务 管理 、 
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容量 管理 、IT 服务 连续 性 管理 和 可 用 性 管理 。 服 务 支 持 模 块 更 多 地 用 于 处 理事 件 管理 、 
问题 管理 、 变 更 管理 、 配 置 管理 、 发 布 管理 及 服务 台 功 能 的 日 向 支持 和 维护 。 

(4) ISO20000 标准 

ISO20000 是 ISO 在 英国 标准 BS15000 的 基础 上 以 ITIL 为 核心 制定 的 IT 服务 管理 
国际 标准 。 着 重 于 通过 “IT 服务 标准 化 ”来 管理 IT 问题 ， 即 将 IT 问题 归 类 ， 识 别 问 题 
的 内 在 联系 ， 然 后 依据 服务 水 准 协 议 进行 计划 、 推 行 和 监控 ， 并 强调 与 客户 的 沟通 。 该 
标准 同时 关注 体系 的 能 力 ， 体 系 变更 时 所 要 求 的 管理 水 平 、 财 务 预 算 、 软 件 控制 和 分 配 。 

ISO20000 是 只 针对 IT 服务 管理 的 认证 标准 ， 与 IT 服务 流程 相关 ， 对 IT 系统 变更 
的 风险 进行 管理 ， 除 IT 的 服务 质量 外 ， 还 关注 相关 产业 的 财务 、 信 息 安 全 等 内 容 。 


16.2.2” 运 维 管 理 的 实现 


基于 ISO 20000, ISO 27001, ISO 9001 和 ITIL 等 标准 ， 对 数据 中 心 的 管理 应 该 尽量 
做 到 “多 重 符 合 性 ”: 一 方面 要 依据 上 述 标准 的 要 求 建立 不 同 的 管理 流程 与 体系 ;， 另 一 方 
面 又 要 让 员工 能 在 日 常 工作 中 不 会 因为 上 面 有 太 多 的 条 条 框框 而 无 所 适 从 ; 最 后 ， 就 是 
要 规划 好 这 些 管理 体系 之 间 的 关系 ， 定 义 好 这 些 管理 体系 之 间 的 接口 ， 使 所 有 的 管理 体 
系 均 获 得 良好 的 管理 与 维护 。 

1. 运 维 管理 的 实现 框架 模型 

运 维 管理 的 实现 框架 ITIL 给 出 了 一 个 很 好 的 模型 ， 即 
4Ps 模型 ， 如 图 16-3 Pras. 

(1) AR 

人 员 管 理 是 数据 中 心 运 维 管理 的 基础 , 也 是 数据 中 心 运 
维 管理 的 核心 。 数据 中 心 作为 IT 设备 、 基础 设施 、 监 控 设备 、 。 
系统 与 数据 、 管 理工 具 和 人 员 的 集合 体 ， 只 有 具有 专业 知识 MO? TR aps me 
和 管理 经 验 的 人 ， 才 能 有 效 地 整合 数据 中 心 内 资源 ， 为 客户 提供 质量 达标 的 服务 。 因 此 ， 
人 员 方 面 的 管理 尤为 重要 。 对 数据 中 心 人 员 方 面 的 管理 应 该 涵盖 对 新 员工 在 专业 方面 的 培 
训 、 在 岗 职 工 职位 的 明确 和 主观 能 动 性 的 挖掘 、 合 理 的 绩效 体系 、 岗 位 设计 和 部 门 协调 、 
人 员 评 测 考评 〈 包 括 客 户 评测 、 上 属 评测 和 自我 评测 等 ) 、 文 化 活动 和 价值 观 的 建设 。 

(2) 流程 

流程 是 数据 中 心 运 维 质量 的 保证 。 在 流程 管理 中 ， 运 维 团 队 不 仅 要 考虑 流程 的 设立 
与 改进 ， 也 要 积极 监督 流程 内 工作 的 进度 和 质量 。 流 程 管理 还 包括 人 员 管 理 、 技 术 管 理 、 
运营 流程 内 质量 管理 、 运 营 流 程 内 监控 辅导 、 业 务 处 理 、 客 户 处 理 、 内 部 协调 、 跟 踪 反 
馈 、 平 台 运 维和 财务 管理 。 数 据 中 心 需要 把 现在 的 管理 工作 抽象 成 不 同 的 管理 流程 ， 并 
详细 定义 流程 之 间 的 关系 、 流 程 的 角色 、 流 程 的 触发 点 、 流 程 的 输入 与 输出 等 。 这 种 流 
程 的 建立 ， 一 方面 可 以 使 数据 中 心 的 人 员 能 对 工作 有 统一 的 认识 ， 另 一 方面 使 得 整个 服 
务 提供 过 程 可 被 监控 、 管 理 ， 形 成 真正 意义 上 的 “IT 服务 车 间 ”。 

(3) 产品 

现今 数据 中 心 在 开展 运 维 管理 工作 时 会 选择 更 灵活 的 管理 工具 ， 即 产品 。 通 过 工 
具 的 部 署 来 完成 大 量 重复 性 工作 (如 监控 、 操 作 、 配 置 文件 、 工 作 流 管理 等 ) ， 最 终 
提升 运 维 水 平 、 降 低 运 维 风险 、 减 少 运 维 成 本 。 产 品 是 数据 中 心 运 维 管理 中 不 可 缺少 
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的 一 部 分 。 

(4) 服务 商 

服务 商 是 数据 中 心 运 维 管理 的 支持 者 。 作 为 专业 化 的 数据 中 心 运 维 管理 ， 有 效 地 整 
合 数据 中 心 管理 对 象 ， 并 最 终 为 用 户 提供 专业 化 的 服务 才 是 数据 中 心服 务 提供 者 的 核心 
价值 所 在 ， 而 且 数 据 中 心 运 维 管理 中 涉及 了 太 多 不 同 种 类 的 设备 ， 数 据 中 心 也 不 可 能 独 
目 处 理 所 有 的 技术 与 管理 工作 。 聘 用 一 批 既 懂 变压器 、 发 电机 、UPS， 又 了 解 空 调 、 消 
防 、 防 火 设 备 ， 同 时 还 精通 IT 相关 软 硬 件 的 人 员 ， 对 于 任何 一 个 企业 或 机 构 均 是 极 大 的 
成 本 支出 。 因 此 ， 数 据 中 心 需要 与 许多 设备 供应 和 服务 提供 商 建立 良好 的 战略 合作 关系 。 

2. 数据 中 心 模块 分 级 

从 配置 、 告 警 、 监 控 、 安 全 来 考量 管理 架构 ， 对 数据 中 心 内 部 模块 职责 进行 分 组 ， 
相应 地 决定 管理 模块 ， 如 图 16-4 Ara. 








16-4 数据 中 心 运 维 管理 示意 


(1) 资源 管理 类 

工作 环境 管理 主要 是 对 工作 环境 安全 进行 管理 ， 即 根据 不 同 工 作 区 域 的 特点 ， 相 应 
地 分 配 安全 设备 以 及 进出 管理 控制 制度 。 依 据 各 个 区 域内 所 存放 的 信息 资产 的 等 级 进行 
分 析 ， 建 议 将 数据 中 心 工作 区 域 分 为 三 部 分 : 公共 区 域 、 工 作 区 域 和 核心 区 域 。 公 共 区 域 
主要 用 于 展示 数据 中 心 工 作成 果 和 内 部 人 员 日 常生 活 , 允许 所 有 员工 以 及 获得 许可 的 第 三 
方 人 员 自 由 进出 ; 工作 区 域 主要 用 于 数据 中 心 工 作 人 员 进 行 日 常数 据 处 理 以 及 行政 办 公 等 
工作 内 容 ， 同 时 此 区 域 还 存放 着 相配 套 的 工作 设备 ， 这 类 区 域 的 进出 需要 有 较为 严密 的 申 
请 流程 ， 配 有 监控 系统 ; 核心 区 域 包含 数据 中 心 内 的 核心 信息 的 处 理 设备 以 及 供 配 电 等 基 
础 设备 ， 此 区 域 应 严格 限制 人 员 设 备 进出 ， 配 有 最 高 级 的 门禁 以 及 监控 系统 保证 安全 。 

设备 管理 ， 即 对 数据 中 心 内 所 有 设备 的 固定 资产 管理 和 设备 维护 管理 。 在 设备 管理 的 过 
程 中 ， 可 以 采取 以 下 手段 ， 编制 设备 清单 、 明 确 设备 的 所 有 人 以 及 管理 人 员 ; 制定 设备 的 维 
护 计划 ， 规 定 设备 的 维护 日 期 和 维护 人 员 ， 由 专人 负责 监督 设备 的 按时 维护 ， 对 不 同 工 作 内 
容 的 设备 进行 分 级 制度 ， 并 依据 分 级 制定 不 同 的 管理 策略 ， 最 大 限度 保证 重要 设备 的 运行 。 

网 络 管理 ， 即 对 数据 中 心 内 部 网 络 进行 管理 ， 其 中 主要 包括 绘制 网 络 拓扑 结构 、 控 
制 网 络 访问 和 网 络 系 统 日 常 维护 等 工作 。 在 控制 网 络 访问 方面 ， 应 该 将 数据 中 心 网 络 分 
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为 不 同 的 网 段 ， 如 办 公 网 、 管 理 网 、 公 共 网 络 等 ， 对 数据 中 心 内 所 有 人 员 以 及 设备 职责 
分 配 相 应 的 网 络 访问 权限 ， 由 专门 的 工作 人 员 处 理 对 网 络 的 接 入 和 终止 接 入 请 求 。 网 络 
系统 日 常 维护 方面 主要 包括 设备 的 日 党 维护、 日 志 备 份 、 配 置信 息 备 份 等 。 

应 用 管理 是 对 数据 库 、 中 间 件 和 应 用 系统 本 喘 进行 管理 。 根 据 应 用 系统 提供 的 IT 
服务 的 重要 性 来 对 应 用 系统 划分 级 别 ， 并 以 此 归 类 , 将 应 用 按 重要 程度 分 级 对 于 更 为 合理 
地 分 配 资源 有 重要 意义 。 制 定 系统 结构 图 、 网 络 拓 扑 图 和 应 用 拓扑 图 可 以 快速 了 解 总 体 应 
用 部 署 情况 ， 在 应 用 出 现 故 障 时 ， 迅 速 定位 原因 。 绘 制 应 用 数据 流 ， 用 图 或 表 的 方式 深入 
研究 多 个 应 用 系统 之 间 数 据 的 流向 , 通过 应 用 数据 流 图 ， 可 以 很 清楚 地 知道 一 旦 某 个 设备 
停 运 对 其 他 应 用 系统 的 影响 ， 这 对 于 事件 、 问 题 或 变更 的 影响 评估 有 非常 重要 的 意义 。 

(2) 安全 管理 类 

O 防 病 毒 管理 :主要 是 杀毒 软件 的 更 新 和 设置 、 病 毒 库 的 更 新 、 病 毒 定期 查 杀 、 
软件 版 本 控制 等 。 应 该 安排 专人 或 部 门 了 解 最 新 的 病毒 资讯 , 包含 可 能 爆发 的 病毒 类 型 、 
感染 病毒 后 的 常见 症状 、 新 一 代 病 毒 的 有 效应 对 方案 等 ， 以 上 信息 要 定期 则 数据 中 心 相 
关 人 员 报 告 通 知 。 

D 灾 备 服务 管理 :应 引入 成 熟 的 灾 备 机 制 。 通 过 资产 识别 、 威 胁 识别 、 脆 弱 性 识 
别 来 进行 风险 分 析 ， 通 过 风险 值 进行 风险 分 级 ， 为 后 续 工 作 提 供 参 考 。 建 立 灾 备 中 心 以 
应 对 灾难 风险 ， 灾 备 中 心 的 建立 包含 “同城 灾 备 ”“ 异 地 灾 备 ”“ 同 城 一 异地 灾 备 ”3 
个 模式 。 数 据 中 心 与 灾 备 中 心 建立 网 络 热 备份 体系 ， 当 数据 中 心 无 法 工作 时 ， 能 够 保证 
灾 备 中 心 的 备份 业务 系统 顺利 接管 业务 数据 。 同 时 ， 也 应 及 时 更 新 数据 中 心 防 灾 预 案 ， 
通过 完备 的 预防 措施 降低 人 为 灾难 的 发 生 , 提高 灾难 发 生 时 的 应 对 效率 ， 从 而 降低 风险 。 

(3) 操作 管理 类 

日 常 操作 管理 主要 是 处 理 数 据 内 部 生产 系统 、 办 公 系 统 、 动 力 设备 、 环 境 保护 、 监 
控 系 统 的 数据 ， 数 据 中 心 应 制定 完善 的 用 户 手 册 与 操作 流程 对 整个 日 常 操作 进行 监督 。 
建议 制定 相关 的 巡 检 工作 指引 ， 规 范 数 据 中 心 的 日 常 巡 检 工 作 。 工 作 指 引 应 规定 巡 检 的 
周期 、 巡 检 项 目 、 判 定 设备 正常 的 标准 、 出 现 异 常 后 的 记录 和 汇报 方式 以 及 事件 管理 的 
接口 。 将 巡 检 设备 及 内 容 做 成 检查 表 ， 巡 检 记 录 以 表格 形式 呈现 。 

用 户 密 码 管理 主要 是 妥善 管理 用 户 密码 ， 定 期 更 换 管理 员 密 码 ， 以 降低 数据 中 心 的 
运行 风险 ， 确 保 信 息 安 全 。 对 于 重要 密码 ， 除 在 用 户 处 保留 外 ， 还 应 在 另外 安全 的 地 氮 
保留 密码 副本 ， 以 免 由 于 密码 遗失 对 数据 中 心 运行 造成 影响 。 数 据 中 心 应 建立 一 套 
用 户 密 码 撤销 删除 的 流程 , 重点 加 强 离职 人 员 及 工作 调动 人 员 所 用 密码 的 撤销 管理 。 

(4) 服务 管理 类 

服务 水 平 管理 主要 通过 SLA CARS ACEI) /OLA 〈 运 维 水 平 协议 ) UC (ARE 
约 ) 来 协调 IT 服务 各 方 之 间 的 关系 。 服 务 水 平 管理 主要 包含 以 下 方面 的 内 容 : 识别 客户 
需求 、 定 义 服 务 项 目 、 签 定 相关 协议 、 服 务 级 别 的 监控 与 报告 、 评 审 和 改进 服务 。 

业务 关系 管理 和 服务 报告 管理 。 与 客户 进行 定期 或 不 定期 的 沟通 ， 以 便 对 服务 进 
行 评价 和 改进 ; 对 客户 进行 满意 度 调查 ， 针 对 调查 结果 制定 下 一 步 的 服务 策略 以 迎合 
顾客 需求 ， 数据 中 心 应 设立 咨询 机 构 为 用 户 提供 咨询 服务 和 技术 支持 ， 也 能 够 接受 客 
户 的 抱怨 以 及 投诉 ， 应 针对 客户 抱怨 完成 分 析 报 告 ， 总 结 客户 抱怨 的 原因 ， 制 定 相关 
的 改进 措施 。 规 定 客户 抱怨 的 升级 机 制 ， 对 于 严重 的 客户 抱怨 ， 按 升级 的 客户 投诉 流 
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程 进行 相应 处 理 。 

(5) 监控 管理 类 

监控 管理 类 对 以 上 管理 内 容 进 行 监督 和 反馈 ， 可 以 设立 专职 人 员 和 部 门 ， 重 要 场所 
应 设置 监控 器 。 对 数据 中 心 的 监控 应 该 包含 基础 环境 监控 、IT 系统 监控 、 服 务 流 程 监控 
等 方面 ， 即 将 监控 应 用 于 以 上 所 有 管理 内 容 中 ， 确 保 整个 管理 工作 顺利 进行 。 


16.3 ”华为 ICT 管理 的 实现 与 应 用 


16.3.1 ICT 管理 的 实现 


1. CT 与 IT 的 业务 、 技 术 及 运 维 走向 融合 

移动 互联 网 、 物 联网 等 新 兴 领 域 用 户 的 增长 ， 为 运营 商 带 来 了 新 的 发 展 机 遇 ，ICT 
业务 和 云 业 务 成 为 拉动 运营 商 收 入 增长 的 重要 驱动 力 。 云 计算 和 SDN 的 技术 发 展 使 CT 
与 开 趋向 融合 。 为 进一步 实现 效率 提升 和 成 本 最 优 ，CT 与 IT 的 融合 运 维 成 为 运营 商 的 
理想 选择 。 

运营 商 需要 改变 目前 CT. IT 独立 维护 的 运 维 模式 ， 推 进 ICT 融合 运 维 ， 利 用 高 效 
的 统一 运 维 流程 、 端 到 端的 服务 管理 以 及 成 熟 的 运 维 工 具 平 台 ， 提 升 服务 水 平 ， 降 低 运 
维 成 本 ; 通过 ICT 融合 运 维 ， 提 供 涵 盖 从 网 络 到 IT 应 用 的 端 到 端 保障 ， 支 撑 业 务 运 营 。 

华为 ICT 融合 运 维 解决 方案 主要 通过 流程 、 平 台 、 工 具 及 专家 团队 帮助 运营 商 实现 
CT 与 IT 的 运 维 融合 ， 通 过 华为 全 球 的 运 维 经 验 和 业务 流程 实践 ， 利 用 统一 的 流程 和 平 
Ar Mig Bl Big Hh SCE ICT 业务 。 

2. HA ICT 融合 运 维 能 力 

华为 运用 先进 技术 E-iNOC 平台 ， 涵 盖 故 障 管理 、 性 能 管理 、 派 单 系统 、 资 源 管理 、 
人 员 绩 效 管理 等 方面 ， 通 过 顶尖 的 运 维 管理 平台 一 一 全 球 3 个 GNOC， 执 行 符合 
eTOM&ITIL 标准 的 MSUP 运 维 流程 。 

华为 ICT 使 用 业内 领先 的 全 球 专家 团队 ， 以 及 专业 资质 ISO20000 和 1ISO27001) 、 
TL9000. TM 论坛 认证 的 MSUP 运 维 流程 为 用 户 提 供 全 面 可 靠 的 运 维 管理 。 

3. ICT 融合 运 维 解决 方案 给 客户 带 来 的 价值 
端 到 端的 SLA 管控 ， 提 升 服务 水 平 。 
缩短 新 业务 的 上 线 时 间 ， 实 现 快速 商用 。 
CT SIT 协同 运 维 ， 提 升 效率 ， 进 一 步 降 低 OPEX. 
共享 华为 全 球 最 佳 实 践 经 验 。 


16.3.2 下 一 代数 据 中 心 管理 方案 一 一 ManageOne 

华为 ManageOne 数据 中 心 管理 解决 方案 是 一 个 智能 、 高 效 、 联 动 、 便 捷 的 数据 中 心 
运营 运 维 统一 管理 平台 。 

ManageOne 主要 包括 管理 门户 、 运 营 管 理 、IT 服务 管理 、 资 源 管理 、IT 运 维 管理 
和 基础 设施 管理 6 个 模块 ， 如 图 16-5 所 示 。 
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图 16-5 ManageOne 数据 中 心 解 决 方案 架构 


运营 管理 包含 用 户 管理 、 产 品 管理 、 资 产 管理 、 订 单 管理 、 计 量 管理 、 自 助 服务 系 
统 等 。 华 为 云 业 务 运营 管理 流程 参考 了 业界 先进 的 管理 模型 ， 结 合 了 华为 在 运营 商 领 域 
的 经 验 ， 提 供 了 融合 统一 的 运营 管理 模型 。 其 主要 优势 有 : 模块 化 架构 ， 低 时 间 门 槛 ; 
fA AA MNS RE, HARARE. 

IT 服务 管理 包含 服务 台 、 事 件 管理 、SLA 管理 、 问 题 管 理 、 配 置 管理 和 变更 管理 等 。 
其 主要 优势 有 : 遵循 ITIL V3 的 15 项 认证 ; 完全 基于 Web, 集成 简单 ， 操 作 方 便 ; SDM 
和 CMDB 完整 融合 ， 能 够 跨越 所 有 IT 领域 实施 管理 任务 。 

IT 运 维 管理 主要 包括 业务 影响 分 析 、 告 警 、 拓 扑 、 性 能 、 报 表 、 服 务 器 监控 、 存 储 
监控 、 网 络 监 控 、 数 据 库 监控 、 中 间 件 监控 以 及 应 用 性 能 监控 等 。 其 主要 优势 有 : BF 
台 支 持 ， 实 时 性 能 监控 ， 自 动 门限 值 设 定 ， 直 观 的 管理 界面 ， 集 中 性 能 配置 管理 。 

资源 管理 包括 应 用 部 署 ， 资 源 管理 、 分 配 和 目 动 化 部 署 和 配置 ， 支 持 对 物理 资源 和 虚 
拟 资源 的 自动 化 管理 。 其 主要 优势 有 : 可视化 的 设计 ， 通 用 的 集成 功能 ， 自 动 发 现 、 配 置 。 

基础 设施 管理 包括 3D 机 房 可视化 、 能 耗 管理 、 动 力 管理 、 环 境 监 控 等 。 其 主要 优 
AA: 可 监控 的 底层 设备 比较 多 样 ， 包 含 动力 监控 、 环 境 监 控 和 视频 监控 , 3D 可 视 化 技 
术 展 示 更 直观 。 


16.4 本章 总 结 


完成 本 章 学 习 ， 将 能 够 : 
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了 解 IT 运营 维护 的 基本 知识 。 

了 解数 据 中 心 的 构成 和 作用 。 

了 解 传统 数据 中 心 面临 的 挑战 。 

了 解 IT 数据 中 心 统一 运 维 管理 的 标准 和 实现 。 
了 解 华 为 ICT 管理 的 实现 与 应 用 。 


16.5 练习 题 


一 、 选 择 题 
1. WF ¢ ) 方面 的 管理 不 属于 IT 运 维 管理 。 
A. 设备 管理 B. 资产 管理 C. 信息 安全 管理 D. 行政 管理 
答案 (D) 
2. 以 下 关于 数据 中 心 的 描述 ， 错 误 的 是 Jo 
A. 数据 中 心 又 称 服 务 器 场 
B. 数据 中 心 将 具有 相同 环境 要 求 以 及 安全 需求 的 设备 集中 安置 以 便 维 护 
C. 数据 中 心 的 功能 仅 限 于 数据 存储 
D. 数据 中 心 也 可 以 为 用 户 提 供 服务 与 应 用 
答案 (C) 
3. 数据 中 心 的 运营 成 本 主要 体现 在 C A 
A. 房屋 建筑 成 本 和 土地 成 本 的 开销 
B. 设备 成 本 ， 包 括 设备 购买 成 本 或 租金 
C. 支持 设备 工作 的 水 电 等 能 源 开 销 
D. 网 络 通 信 费 用 ， 如 互联 网 通信 、 电 话 通信 和 专线 通信 等 费用 
答案 (ABCD) 
4. 4Ps 模型 是 以 下 ( ) 质量 管理 框架 提出 的 。 
A. ISO 9001 B. ITIL C. ISO 27001 D. ISO 20000 
答案 (B) 
5. 4Ps 模型 中 的 4P 分 别 是 指 〈 
A. 人员、 流程 B. 产品 、 服 务 商 
C. 服务 器 、 驱 动 程 序 D. 执行 、 反 馈 
答案 (AB) 


二 、 简 答题 

1. 传统 数据 中 心 面临 的 四 大 挑战 是 什么 ? PUE 的 概念 是 什么 ? 为 什么 说 数据 中 心 
的 平台 化 是 必要 的 ? 

2. 说 明 4Ps 管理 模型 中 的 4P 各 代表 什么 含义 。 

3. 说 明 数 据 中 心 运 维 管理 中 资源 管理 模块 包含 的 内 容 ， 并 给 出 管理 方案 。 


五 











à 一 — 


ele 


ss E N 


342 信息 存储 与 IT 管理 


缩 略语 
re BATA 
Ac DHENE 
MD oe 
AR RAT 
An sa aR 
asic FR 
MIAE OE 
BBU 条 用 电池 部 人 
cu wo 
Cav i | ace AAS 
X roe 
cro BRT 
Das MEERN 
DDR ai 
Dir PAREA 
DNS BERA 
ECC MARERA 
ERP cnr 
rT Sea 
T T 
Gul TT 
HA 机 可用 
HBA ES RE 
HTTP EAEE 
DC | memean con | ena 
PM Weta 





OLAP 
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Internet protocol television 
integrated storage manager 
Just bundle of disks 


lightweight directory access protocol 


logical unit number 
mobile directory number 


management information system 


multi level cell 

network attached storage 
native command queuing 
network interface card 
network information service 
office automation 


on-line analytical processing 


on-line transaction processing 


object storage controller node 


petabyte 


redundant array of independent disks 


remote direct memory access 


self monitoring analysis and reporting technology 


storage area network 


serial attached SCSI 


serial advanced technology attachment 


small computer system interface 


single disk virtualization 
small form-factor pluggable 
single instance repository 
secret key 


single level cell 


simple network management protocol 


self organization disk 
sea of disks 

solid state disk 
terabyte 


transmission control protocol 
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联机 事务 处 理 系统 
对 象 存 储 控制 器 节点 
拍 字 节 
独立 见 余 存储 阵列 
远程 直接 数据 存 取 
自我 监测 、 分 析 和 报告 技术 
存储 区 域 网 络 
串 行 SCSI 
串 行 ATA 

小 型 计算 机 系统 接口 
单 盘 虚拟 化 

光 模 块 
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单 层 单元 
简单 网 络 管理 协议 
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( 续 表 ) 


t 


UDS 


UID 


active firmware 
active zone set 
activity LED 
administrative 
state 


advanced RISC 
machines 


alarm 
alias 
arbitrated loop 


arbitrated loop 
physical address 
ASIC 


ATA 


auto save 
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(ER) 








= A maa 
= EREN 
= ET 
iai a 3 
术语 
访问 控制 表 又 称 存 取 控 制 串 列 , 是 使 用 以 访问 控制 矩阵 为 基础 的 访问 控制 方法 ， 
access control list | 每 一 个 对 象 对 应 一 个 串 行 主体 。 访 问 控制 表 描 述 每 一 个 对 象 各 自 的 访问 控制 ， 
并 记录 可 对 此 对 象 进行 访问 的 所 有 主体 对 对 象 的 权限 
access node 存 取 节点 ， 一 个 转换 点 ， 它 由 一 个 网 络 终端 接 入 点 组 成 
active directory | Windows Server 中 , 负责 架构 中 大 型 网 络 环境 的 集中 式 目 录 管 理 服务 (directory service) 


交换 机 中 正在 使 用 的 固件 〈firmware) 镜像 

光纤 网 络 中 处 于 激活 状态 的 分 区 组 

用 于 指示 数据 帧 收发 的 端口 指示 灯 

决定 端口 、IO 插 片 或 交换 机 的 操作 状态 , 已 配置 好 的 管理 状态 存放 在 交换 机 配 
置信 息 中 ， 并 可 用 CLI 命令 临时 修改 

一 个 32 位 精简 指令 集 (RISC〉 处 理 器 架构 ， 其 广泛 应 用 于 许多 檬 入 式 系 统 设计 


交换 机 所 产生 的 需要 引起 注意 的 信息 ， 某 些 告警 的 紧急 级 别 可 自行 配置 
别名 是 一 组 端口 或 设备 的 总 称号 ， 别 名 不 是 分 区 ， 其 成 员 不 能 是 分 区 或 其 他 的 别名 
一 种 FC 拓扑 布局 ， 此 结构 中 各 端口 使 用 仲裁 算法 建立 点 到 点 回路 


仲裁 环 物理 地 址 ， 在 环 路 初始 化 过 程 中 ， 使 用 lbyte 的 值 来 唯一 确定 环 路 中 的 
NL port 

专用 集成 电路 ， 是 针对 特定 应 用 设计 的 集成 电路 必 片 

ATA 技术 是 一 个 关于 IDE (integrated device electronics) 的 技术 规范 族 ， 随 着 
IDE/EIDE 的 日 益 广泛 应 用 , 全 球 标准 化 协议 将 该 接口 自 诞生 以 来 使 用 的 技术 规 
范 归 纳 成 为 全 球 硬盘 标准 

此 参数 决定 光纤 网 络 中 的 交换 机 接收 到 其 他 交换 机 的 活动 分 区 变更 时 ， 是 否 将 
该 变更 保存 到 此 交换 机 中 的 非 易 失 性 存储 介质 中 





波 特 率 即 调制 速率 ， 是 指 信和 号 被 调制 以 后 在 单位 时 间 内 的 变化 ， 即 单位 时 间 内 
载波 参数 变化 的 次 数 

自 举 协议 (BOOTP)〉 是 一 个 基于 IP/UDP 的 协议 ， 它 可 以 让 无 盘 站 从 一 个 中 心 
服务 器 上 获得 IP 地 址 ， 为 局 域 网 中 的 无 盘 工 作 站 分 配 动态 IP 地 址 ， 并 不 需要 
每 个 用 户 设 置 静态 IP 地 址 





buffer credit 


cache 
cache 低 水 位 


cache 高 水 位 
cache 命中 率 
cache 预 取 策 略 
cascade 


cascade topology 


CHAP 


class 2 service 
class 3 service 
CLI 


cluster 


configured zone 
sets 


CRC 


CSS 


附录 ARENE as 
( 续 表 ) 
FONE AAA FR, TTA RRM AEEA 


Rant EME ai: aE ET amen es 
地 址 存储 在 该 区 域 来 提高 性 能 


cache 中 存储 脏 数据 的 最 低 限 制 值 。 当 cache 中 存储 的 脏 数据 量 到 达 该 值 时 ， 
cache 暂停 将 cache 中 的 脏 数 据 同步 到 硬盘 


cache 中 存储 脏 数据 的 最 高 限制 值 ， 当 cache 中 存储 的 脏 数 据 量 到 达 该 值 时 ， 
cache 开始 将 cache 中 的 脏 数 据 同 步 到 硬盘 中 


在 读 操作 过 程 中 ， 从 cache 中 直接 命中 的 IO 占 所 有 VO 操作 的 百分比 


根据 当前 已 读 或 者 正在 读 操作 ， 按 照 一 定 的 策略 ， 提 前 将 需要 读 的 数据 从 硬盘 
读 入 cache 中 


级 联 ， 通 过 连接 线 绕 为 存储 系统 接 入 更 多 的 硬盘 框 ， 实 现存 储 系统 容量 扩充 操作 


一 种 光纤 交换 机 连接 方式 : 各 交换 机 串 行 连接 ， 并 且 首 未 相连 而 组 成 的 光纤 网 
络 ， 此 拓扑 结构 即 为 瀑布 式 级 联 拓 扑 


盘问 握手 认证 协议 ， 是 密 文 传送 的 密码 验证 方式 ， 为 三 次 握手 验证 ， 口 令 为 密 
文 〈 密 铀 )。 首 先 验证 方向 被 验证 方 发 送 一 些 随机 产生 的 报 文 《challenge); 然 
后 被 验证 方 用 自己 的 口令 字 和 MDS 算法 对 该 随机 报 文 进行 加 密 , 将 生成 的 密 文 
发 回 验 证 方 (response); 最 后 验证 方 用 自己 保存 的 被 验证 方 口令 字 和 MD5 算法 
对 原 随 机 报 文 加 密 ， 比 较 三 者 的 密 文 ， 根 据 比 较 结 果 返 回 不 同 的 响应 
(acknowledge or not acknowledge) 


一 种 非 连接 的 光纤 交互 服务 ， 它 多 路 复 用 了 来 自 一 个 或 多 个 N_Ports 或 者 
NL_Ports 节点 端口 的 框架 


一 个 非 连接 的 光纤 交互 服务 ， 它 多 路 复 用 了 来 自 或 者 到 达 一 个 或 多 个 N Ports 
或 者 NL Ports 节点 端口 的 框架 


命令 行 界面 ， 是 图 形 用 户 界 面 普及 之 前 使 用 最 为 广泛 的 用 户 界面 ， 它 通常 不 支 
持 鼠 标 ， 用 户 通过 键盘 输入 指令 ， 计 算 机 接收 到 指令 后 ， 予 以 执行 


计算 机 集群 简称 集群 ， 是 一 种 计算 机 系统 ， 它 通过 一 组 松散 集成 的 计算 机 软件 
和 /或 硬件 连接 起 来 高 度 紧密 地 协作 完成 计算 工作 

保存 在 交换 机 中 的 分 区 组 〈 不 包括 活动 分 区 组 ) 

一 种 根据 网 络 数据 包 或 计算 机 文件 等 数据 产生 简短 固定 位 数 校 验 码 的 一 种 散 列 
函数 ， 主 要 用 来 检测 或 校 验 数 据 传 输 或 者 保存 后 可 能 出 现 的 错误 


云 存 储 系统 ， 是 通过 集群 应 用 、 网 格 技 术 或 分 布 式 文件 系统 等 功能 ， 将 网 络 中 
大 量 不 同类 型 的 存储 设备 通过 应 用 软件 集合 起 来 协同 工作 ， 共 同 对 外 提供 数据 
tad 问 he lake, 





DAS 
DDR 


default visibility 


distributed Hash 
table 


一 个 没有 存储 网 络 接 入 ， 直 接连 接 到 服务 器 和 工作 站 的 数字 存储 系统 。 


双 倍 速率 同步 动态 随机 存储 器 ， 是 在 SDRAM 内 存 基础 上 发 展 而 来 的 ， 仍 然 沿 
用 SDRAM 生产 体系 


在 没有 活动 分 区 组 的 情况 下 ， 此 分 区 参数 决定 了 端口 /设备 之 间 的 通信 级 别 


一 种 分 布 式 存储 方法 。 在 不 需要 服务 器 的 情况 下 ， 每 个 客户 端 负责 一 个 小 范围 
的 路 由 ， 并 负责 存储 一 小 部 分 数据 ， 从 而 实现 整个 DHT 网 络 的 寻 址 和 存储 
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DNS 


domain ID 


DRAM 


DTD 





_ Port 


erasure code 







fabric database 


fabric management 


switch 
fabric name 
fabric view file 
failover 
FDMI 
fibre channel 
FL Port 
flash memory 
frame 
FRU 
FT feature 
FTP 
G Port 
GL Port 


GUI 
hard zone 


HBA 
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域名 系统 是 | PP + 的 一 项 核心 服务 ， 它 作为 可 以 将 域名 和 IP > 地 址 相互 映射 的 
一 个 分 布 式 数据 库 ， 能 够 使 用 户 更 方便 地 访问 互联 网 ， 而 不 用 记 住 能 被 机 器 直 
接 读 取 的 IP 数 串 


用 于 在 Fabric 网 络 中 标识 交换 机 


动态 随机 存 取 存 储 器 ， 是 最 为 常见 的 系统 内 存 。DRAM 只 能 将 数据 保持 很 短 的 
时 间 。 为 了 保持 数据 , DRAM 使 用 电容 存储 , 因此 必须 隔 一 段 时 间 刷 新 refresh ) 
一 次 ， 如 果 存 储 单元 没有 被 刷新 ， 存 储 的 信息 就 会 丢失 


(document type definition, DTD) 是 一 套 关 于 标记 符 的 语法 规则 。 它 是 XML1.0 
版 规格 的 一 部 分 , 是 XML 文件 的 验证 机 制 , 属于 XML 文件 组 成 的 一 部 分 .DTD 
是 一 种 保证 XML 文档 格式 正确 的 有 效 方法 ， 可 通过 比较 XML 文档 和 DTD X 
来 看 文档 否 符合 规 ae nih 











级 于 级 连 (ISL 其 他 的 交换 机 


纠 删 码 是 一 种 为 二 进位 删除 信道 设计 的 前 向 错误 更 正 编码 , 能 把 长 度 的 信息 ， 
转换 为 更 长 的 n 长 度 的 信息 ， 而 全 部 信息 可 以 从 n 的 子 集中 恢复 





edd ell a H ta. B- 


交换 机 连接 端口 ， 用 于 连接 两 个 X_ Pors 


QuickTools 启动 时 所 打开 的 各 光纤 网 络 的 配置 信息 
用 于 管理 光纤 网 络 的 交换 机 


由 用 户 定 义 的 文件 名 称 ， 此 文件 记录 了 光纤 网 络 中 的 用 户 列表 数据 

此 文件 记录 了 QuickTools 前 次 启动 时 所 打开 和 保存 的 各 个 光纤 网 络 信息 
错误 发 生 时 ， 自 动 切换 交换 机 的 主 控制 CPU。 与 之 相对 的 是 switchover 

光纤 设备 管理 接口 

一 种 高 速 网 络 基础 标准 〈“T11)， 主 要 应 用 于 SAN (存储 局 域 网 ) 

用 于 连接 loop 环 上 其 他 设备 的 Fabric 端口 

交换 机 中 存放 了 chassis control firmware 的 存储 器 

FC 协议 层 链 路 传输 最 小 单元 ， 由 SOF、header、data payload, CRC 和 EOF 组 成 
现场 可 更 换 单元 

用 于 实现 1 台 5120 内 的 2 CPU 插 片 间 的 fail-over 










F 人 A ts Ei 


MWC, FIDLE F Port RI E Por MEAT 


通用 端口 ， 可 以 在 FL Port 和 EE Port 间 自 行 切换 
图 形 用 户 界面 《又 称 图 形 用 户 接 口 ) 是 指 采 用 图 形 方 式 显 示 的 计算 机 操作 用 户 





”| Fil 


一 个 其 区 成 员 可 以 允许 通过 光纤 网 络 与 男 一 个 区 成 员 交流 的 分 区 


主机 总 线 适 配器 ， 指 一 个 使 计算 机 在 服务 器 和 存储 装置 间 提 供 输入 /输出 〈IO) 
处 理 和 物理 连接 的 电路 板 和 /或 集成 电路 适配器 


heartbeat LED 
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hyper stack 


IDC 


inactive firmware 
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input power LED 
inter-switch Link 


IPTV 


iSCSI 


指示 交换 机 处 理 器 和 上 电 自 检 结果 的 IID č č 


5120 a tosan IEE Stack H, ISL 


Es 
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传输 时 延 ， 指 一 个 站 点 从 开始 发 送 数据 帧 到 数据 帧 发 送 完毕 所 需 的 全 部 时 间 ， 
也 可 以 是 接收 站 点 接收 一 个 数据 帧 的 全 部 时 间 


是 一 种 详细 规定 了 浏览 器 和 万 维 网 服务 器 之 间 互 相通 信 的 规则 ,是 通过 Internet 
传送 万 维 网 文档 的 数据 传送 协议 





可 以 为 用 户 提供 包括 申请 域名 、 租用 虚拟 主机 空间 、 主机 托 
管 等 服务 。 此 外 ， 还 有 国际 数据 公司 、 初 始 直接 费用 等 多 种 含义 


交换 机 没有 启用 的 Firmware 镜像 
一 台 交 换 机 通过 内 连 方式 管理 男 一 台 交 换 机 


数据 交换 发 起 方 设备 ， 与 之 相对 的 是 target 

一 种 数据 传输 方式 ， 要 求 数据 帧 的 接收 顺序 与 发 送 时 的 顺序 相同 
该 LED 用 于 指示 交换 机 接收 到 了 适宜 的 直流 电压 

一 种 交换 机 连接 方式 ， 两 台 交 换 机 使 用 E_Ports 端口 连接 


交互 式 网 络 电视 ， 是 一 种 利用 宽带 有 线 电视 网 ， 集 互联 网 、 多 媒体 、 通 信 等 技 
术 于 一 体 ， 向 家 庭 用 户 提供 包括 数字 电视 在 内 的 多 种 交互 式 服务 的 撕 新 技术 


iSCSI RA IBM 公司 研发 的 , 供 硬件 设备 使 用 的 可 以 在 四 协议 的 上 层 运行 的 
SCSI 指令 集 ， 这 种 指令 集合 可 以 在 IP 网 络 上 运行 SCSI 协议 ， 使 其 能 够 在 诸如 
高 速 征 光 以 大 网 上 选择 路 由 





JBOD 


LDAP 


LIP 
logged-in LED 
LUN 


LUN 格式 化 


LUN 拷贝 


LUN 扩展 
LUN 映射 


LUN 一 致 性 校 验 


re ep eT Ce 


Span。 和 RAID 阵列 不 同 ，JBOD 没有 前 端 逻辑 来 管理 磁盘 上 的 数据 分 布 ， 相 
反 ， 每 个 磁盘 单独 寻 址 ， 作 为 分 开 的 存储 资源 ， 或 者 基于 主机 软件 的 一 部 分 ， 


ed A zai 


GREE AULA? IETF VL, EF XS RERE, ERAS 


目录 下 的 对 象 和 数据 
环 路 初始 化 原始 序列 
指示 设备 登录 或 环 路 初始 状态 的 端口 LED 
逻辑 单元 号 ， 主 机 可 访问 的 一 个 逻辑 硬盘 


在 逻辑 驱动 器 的 数据 区 上 写 0， 并 且 生 成 相应 的 奇偶 位 ， 使 允 辑 驱动 器 处 于 承 
绪 状 态 的 操作 过 程 


LUN 拷贝 可 以 在 离线 或 者 在 线 状态 下 将 源 LUN 中 的 数据 拷贝 到 目标 LUN F, 
Ya LUN 和 目标 LUN 可 以 在 不 同 阵列 设备 上 


将 一 个 LUN 连接 到 其 他 LUN 上 形成 一 个 更 大 的 LUN 的 过 程 
将 LUN 配置 给 特定 的 主机 /主机 组 访问 的 操作 


LUN 一 致 性 校 验 是 控制 器 的 一 种 高 级 数据 维护 功能 。 控 制 器 可 以 通过 一 致 性 校 
验 预先 检查 阵列 上 的 数据 是 否 一 致 ， 即 数据 的 正确 性 和 完整 性 
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maintenance mode 


management 
information base 

management 

workstation 


mesh topology 


multistage topology 


a Ra, _—_ 


ah 
f ~w è 
eo" 


NAS 


N Port 
NIC 


NL Port 


| 此 按钮 用 于 维护 模式 下 重 置 交换 机 


maintenance button 
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( 续 表 ) 


sini PN seh 


一 种 光纤 交换 机 工作 模式 ， 此 模式 下 会 设置 交换 机 的 IP 地 址 为 10.0.0.1， 此 工 
作 模 式 用 于 用 户 维护 交换 机 


用 于 开启 或 关闭 SNMP 功能 的 参数 


通过 光纤 网 络 管理 员 交 换 机 来 管理 光纤 网 络 的 PC 工作 站 


一 种 交换 机 连接 方式 : 在 此 级 联 方式 下 ， 光 纤 网 络 中 各 交换 机 之 间 至 少 有 一 个 
端口 直接 连接 


一 种 光纤 交换 机 连接 方式 : 光纤 网 络 中 两 个 或 多 个 边缘 交换 机 连接 到 了 一 个 或 


Rat Ed 


网 络 附属 存储 是 一 种 将 分 布 、 独 立 的 数据 整合 为 大 型 、 集 中 化 管理 的 数据 中 心 ， 
以 便于 对 不 同 主机 和 应 用 服务 器 进行 访问 的 技术 

节点 端口 ， 节 点 可 以 是 存储 、 磁 盘 机 / 库 等 

一 块 电路 板 或 者 卡 ， 安 装 在 计算 机 ， 可 以 连接 到 网 络 

节点 端口 ， 用 于 连接 loop 环 上 的 其 他 节点 ， 或 者 与 交换 机 的 FL_Port 连接 ， 或 
者 通过 NL Port 到 F_Port 再 到 N_Port 

网 络 适 配器 ， 是 计算 机 与 局 域 网 互 连 的 设备 

Sun Microsystem 于 1985 年 发 布 的 一 项 目录 服务 技术 (diretory service)， 用 来 集 
中 控制 几 个 系统 管理 数据 库 的 网 络 用 品 









OSD 


orphan zone set 


N Port 端口 ID 虚拟 化 参数 ， 此 参数 是 否 “Enable” 决 定 了 N_Port 端口 是 否 具 


BE ol 


对 象 存储 设备 ， 一 个 由 SNIA AI INCITS T10 定义 的 基于 对 象 的 存储 标准 
不 从 属于 分 区 组 的 分 区 被 默认 从 属 “orphan zone set”， 它 并 非 实际 存在 的 分 区 


OSS | 组 ， 但 可 用 于 显示 没有 从 属于 任何 分 区 组 的 分 区 


PB 


pending firmware 
port binding 
POST 
principal Switch 


RAID 


RAID 级 别 


RAID 级 别 动态 
迁移 
RAID 组 动态 扩 盘 
RAID 组 失效 


拍 字 节 ，1PB=1024TB 


将 在 交换 机 下 次 重启 时 激活 的 Firmware 镜像 
定义 交换 机 端口 的 可 访问 设备 WWN 列表 
上 电 过 程 中 自动 检测 错误 程序 
光纤 网 络 中 管理 域 ID 分 配 的 交换 机 


一 个 部 分 物理 存储 空间 用 来 存储 放置 在 剩余 存储 空间 中 有 关 用 户 数据 的 宛 余 信 


息 的 硬盘 阵列 


指 不 同 元 余 类 型 在 逻辑 驱动 器 上 的 应 用 。 它 可 以 提高 逻辑 驱动 器 的 故障 容许 度 
和 性 能 ， 但 也 会 减少 逻辑 驱动 器 的 可 用 容量 ， 每 个 逻辑 驱动 器 都 必须 指定 一 个 
RAID 级 别 


在 不 影响 RAID 组 正常 业务 的 情况 下 ， 更 改 RAID 级 别 


在 不 影响 RAID 组 正常 业务 的 情况 下 ， 增 加 RAID 组 成 员 盘 
RAID 组 由 于 成 员 盘 失效 数 超过 其 最 大 范围 ， 导 致 RAID 无 法 继续 提供 服务 





random access 
memory 


reed-solomon 


RSCN 


SAN 


SCSI 


Server 


SFP 
SNMP 
soft zone 


solid state disk 


SRAM 


stack 


strip 


stripe 





switchover 





target 


transmission 


control protocol 


trunk 








synchronization 
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随机 存储 器 。 存 储 单元 的 内 容 可 按 需 随意 取出 或 存 入 ， 且 存 取 的 速度 与 存储 单 
元 的 位 置 无 关 的 存储 器 。 这 种 存储 器 在 断 电 时 丢失 其 存储 内 容 ， 故 主要 用 于 存 
储 短 时 间 使 用 的 程序 

远程 直接 数据 存 取 , 是 为 了 解决 网 络 传输 中 服务 器 端 数 据 处 理 的 延迟 而 产生 的 。 
RDMA 通过 网 络 把 资料 直接 传 入 计算 机 的 存储 区 ， 将 数据 从 一 个 系统 快速 移动 
到 远程 系统 存储 器 中 ， 而 不 对 操作 系统 造成 任何 影响 ， 这 样 就 不 需要 用 到 多 少 
计算 机 的 处 理 功 能 

即 reed-solomon codes， 是 一 种 前 向 错误 更 正 的 信道 编码 ， 对 由 校正 过 采样 数据 
产生 的 多 项 式 有 效 

注册 状态 更 改 通知 , 在 Fabric 网 络 中 , 任意 设备 的 状态 更 改 会 主动 通知 到 Fabric 
网 络 中 的 所 有 设备 


Epo 存储 区 域 网 络 是 一 种 高 速 网 络 或 子 网 络 ， 提 供 在 计算 


机 与 存储 系统 之 间 的 数据 传输 。 存 储 设备 是 指 一 张 或 多 张 用 于 存储 计算 机 数据 
的 磁盘 设备 


小 型 计算 机 系统 接口 ， 一 种 用 于 计算 机 和 智能 设备 之 间 【〈 人 硬盘 、 软 驱 、 光 驱 、 

打印 机 、 扫 描 仪 等 ) 系统 级 接口 的 独立 处 理 器 标准 。SCSI 是 一 种 智能 的 通用 接 
口 标准 。 它 是 各 种 计算 机 与 外 部 设备 之 间 的 接口 标准 

服务 器 ， 指 局 域 网 中 一 种 运行 管理 软件 以 控制 对 网 络 或 网 络 资源 (磁盘 驱动 器 、 

打印 机 等 ) 进行 访问 的 计算 机 ， 并 能 够 为 网 络 上 的 计算 机 提供 资源 ， 使 其 犹如 
工作 站 那样 进行 操作 

光 模 块 

管理 监控 网 络 通信 和 功能 的 应 用 层 协议 

一 个 其 区 成 员 可 以 允许 通过 光纤 网 络 与 其 他 所 有 区 成 员 交 流 的 分 区 

由 固态 电子 存储 芯片 阵列 制 成 的 硬盘 ， 由 控制 单元 和 存储 单元 (FLASH 芯片 、 
DRAM 芯片 ) 组 成 的 硬盘 

静态 随机 存储 器 。 它 是 一 种 具有 静止 存 取 功 能 的 内 存 ， 不 需要 刷新 电路 ， 即 能 
保存 它 内 部 存储 的 数据 ， 但 集成 度 较 低 ， 相 对 体积 较 大 

2120 的 级 连 方式 ， 采 用 专用 Stack 口 ， 非 传统 ISL 

即 条 带 。 在 单个 阵列 盘 区 中 ， 一 系列 连续 编 址 的 硬盘 块 。 阵 列 使 用 分 条 来 将 虚 
拟 硬 盘 块 地 址 映射 为 编号 的 硬盘 块 地 址 ， 也 称 为 分 条 单元 。 

在 N9000 中 指 一 个 分 条 在 其 中 一 个 硬盘 上 的 数据 部 分 

在 使 用 分 条 数据 映射 的 磁盘 阵列 中 ， 每 个 编号 的 磁盘 阵列 盘 区 相应 位 置 的 一 系 
列 条 带 。 条 带 之 间 通 过 某 种 方式 互相 相关 〈 如 相关 盘 区 块 地 址 )， 使 得 分 条 中 的 
成 员 关 系 能 够 被 计算 算法 快速 且 唯 一 地 确定 。 

a ea 中 指 位 于 不 同 硬盘 的 多 个 具有 erasure code 或 其 他 计算 关系 的 数据 的 
手动 转换 交换 机 的 主 控制 CPU， 与 之 相对 的 是 failover 

同步 ， 两 个 或 两 个 以 上 随时 间 变 化 的 量 在 变化 过 程 中 保持 一 定 的 相对 关系 


响应 启动 器 数据 交换 的 目标 存储 设备 ， 与 之 相对 的 是 initiator 

传输 控制 协议 ， 这 是 一 种 面向 连接 〈 连 接 导 向 ) 的 、 可 靠 的 、 基 于 字 节 流 的 运 
输 层 (transport layer) 通信 协议 ， 由 IETF 的 RFC 793 说 明 (specified)。 在 简化 
的 计算 机 网 络 OSI 模型 中 ， 它 完成 第 四 层 传输 层 指定 的 功能 ， 是 一 组 可 以 并 发 
传输 的 端口 
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virtual tape | 虚拟 磁带 库 ， 通 常 为 一 种 专用 的 计算 工具 (appliance)， 它 可 以 仿真 物理 磁带 库 的 
library | 驱动 器 并 且 在 磁盘 上 存储 备份 映像 


64 位 的 设备 唯一 标识 
zone 一 组 端口 或 设备 的 集合 


zone set 分 区 的 集合 
zoning database | 分 区 数据 库 保 存在 交换 机 ， 用 于 记录 分 区 组 、 分 区 、 别 名 等 信息 
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信息 技术 的 飞跃 发 展 ， 市 来 数据 的 爆炸 式 增 长 ， 以 至 于 我 们 生活 的 这 个 时 代 被 标 
记 为 “大 数据 时 代 ”。 大 数据 意味 着 前 所 未 有 的 充分 信息 ， 它 直观 地 揭示 了 事物 的 关 
联 和 规律 ， 对 人 类 社会 有 着 巨大 的 价值 

大 数据 必 不 可 少 的 条 件 是 将 数据 存储 下 来 。 随 着 数据 的 急剧 增长 ， 存 储 技术 日 新 
月 异 ， 存 储 设备 的 种 类 也 越 来 越 多 ， 数 量规 模 越 来 越 大 ， 其 管理 也 越 来 越 复 杂 ， 对 效 
据 中 心 的 设计 人 人员、 运营 管理 人 员 的 要 求 也 越 来 越 高 。 

《信息 存储 与 IT 管理 》 正 是 针对 相关 科技 人 员 和 管理 人 员 的 授 切 需要 而 及 时 推出 的 

-本 很 具 系 统 性 和 实用 性 的 教材 。 作 者 在 总 结 多 年 的 研究 成 果 和 技术 开发 经 验 的 基础 
上 ， 首 先 从 IT 基础 设施 介绍 出 发 ， 深 入 浅 出 地 介绍 了 数据 中 心 、 存 储 与 应 用 环境 、 服 
务 器 的 基本 概念 和 基本 技术 。 在 此 基础 上 ， 了 逐 章 详细 介绍 了 存储 设备 、 存 储 阵列 、 
SAN、IP-SAN、NAS 及 对 象 存 储 等 主流 存储 技术 。 随 后 ， 又 对 存储 虚拟 化 、 备 份 及 容 
灾 等 技术 了 逐 章 详细 讲解 。 最 后 ， 对 大 数据 存储 、 云 计算 技术 等 新 技术 做 了 详细 探讨 
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